Do sieci trafił potężny, tajemniczy model AI - GPT2. Nikt nie wie, skąd się wziął

W sieci pojawił się GPT2. Nowy, tajemniczy chatbot rozwijany przez OpenAI, twórców ChatGPT. Okazuje się, że w niektórych przypadkach GPT2 bije pod względem jakości najbardziej zaawansowany model AI – ChatGPT-4 Turbo. Co ciekawe, do teraz nie wiadomo skąd wziął się ten model, jak został zbudowany i co tak naprawdę potrafi. Internet zalała fala teorii i dyskusji na temat tego czy mamy do czynienia z ChatGPT w wersji 5 czy może zupełnie innym rozwiązaniem.

Pojawienie się „im-a-good-gpt2-chatbot” i jego odpowiednika „im-also-a-good-gpt2-chatbot” wywołało niesamowitą ciekawość i spekulacje w społeczności AI. Oba tajemnicze chatboty pojawiły się na LMSYS org, dużej stronie z testami porównawczymi modeli językowych. Okazuje się, że w niektórzych przypadkach, tajemniczy GPT2 pokonuje model GPT-4. Niektóre osoby twierdzą, iż oba modele przewyższają możliwościami najbardziej zaawansowane, dostępne publicznie technologie od OpenAI.

Nie ma co się więc dziwić, że pojawienie się obu chatbotów doprowadziło do lawiny dyskusji i teorii na temat ich pochodzenia.

im-a-good-gpt2-chatbot
— Sam Altman (@sama) May 5, 2024

OpenAI podkręca atmosferę

Do całej tej otoczki można dorzucić zabawny tweet Sama Altmana, CEO OpenAI. Altman napisał na X po prostu – „im-a-good-gpt2-chatbot” na dzień przed udostępnieniem modeli w sieci. Tym samym podsycił on spekulacje na temat tego, iż OpenAI może przeprowadzać masowe testy A/B na swoich nowych technologiach.

Spekulacje te są dodatkowo wspierane przez fakt, iż LMSYS org zazwyczaj współpracuje z głównymi dostawcami modeli AI w zakresie anonimowych usług testowych – dając firmom dostęp do ogromnej bazy użytkowników. Pomimo intryg, ani OpenAI, ani LMSYS org oficjalnie nie skomentowały sprawy, pozostawiając społeczności teoretyzowanie na temat potencjalnego zaangażowania OpenAI w rozwój obu chatbotów.

Możliwości „im-a-good-gpt2-chatbot” i „im-also-a-good-gpt2-chatbot” były przedmiotem wielu pochwał wśród użytkowników. Niektórzy twierdzą, iż modele te przewyższają obecnie dostępne wersje ChatGPT. Jedna z osób stwierdziła również, iż była w stanie napisać grę mobilną przy pomocy tego modelu – po prostu o to prosząc.

"im-also-a-good-gpt2-chatbot" wins @lmsysorg arena battle using my favorite @MatthewBerman LLM rubric inquiry, "There are three killers in a room. Someone enters the room and kills one of them. Nobody leaves the room. How many killers are left in the room? Explain your reasoning… pic.twitter.com/sWIhs1mKJf
— Shaun Ralston (@shaunralston) May 7, 2024

Tego typu poziom wydajności doprowadził do dalszych spekulacji na temat natury obu chatbotów. Jest bardzo prawdopodobne, że mamy do czynienia ze starszym modelem AI, który został zaktualizowany o nową architekturę. To właśnie dlatego GPT2 miałby działać w tak sprawny sposób.

Mnie najbardziej dziwi jednak fakt, że obu modeli nie da się wybrać z menu w LMSYS (tak, jak innych chatbotów). Jedyne, gdzie można ich spróbować, to mając szczęście w trybie Arena – testując poszczególne prompty. Trzeba więc mieć sporo szczęścia, aby się do nich dostać.

GPT-5 czy jednak nie?

Pomimo braku konkretnych informacji, społeczność AI jest pełna teorii i dyskusji na temat potencjalnych implikacji tych chatbotów. Spekulacje wahają się od możliwości, że są to wersje testowe GPT-4.5 lub nawet GPT-5, po sugestie, że mogą one stanowić zaktualizowaną iterację GPT-2 z 2019 roku, dopracowaną przy użyciu innowacyjnych technik.

W mojej opinii nie ma jednak co liczyć na faktycznie istnienie GPT-5, który miałby być ukryty pod nazwą GPT2. Znając OpenAI ta cała sytuacja to może być po prostu… zwykły trolling.

Chociaż kto wie, niektóre źródła wskazują na to, iż niebawem możemy spodziewać się potężnej zapowiedzi od Amerykanów.

Nadchodzi ChatGPT-5. Kilka osób już go widziało

źródło: QZ / fot. Unsplash.com

AI OpenAI sztuczna inteligencja

Do sieci trafił potężny, tajemniczy model AI – GPT2. Nikt nie wie, skąd się wziął

OpenAI podkręca atmosferę

GPT-5 czy jednak nie?