OpenAI kontratakuje. GPT-5.2 to bezpośrednia odpowiedź na mobilizację w Google

Piotr SojskiSkomentuj
OpenAI kontratakuje. GPT-5.2 to bezpośrednia odpowiedź na mobilizację w Google

Jeszcze w listopadzie sytuacja w OpenAI była napięta. Premiera Gemini 3 od Google sprawiła, że ChatGPT, dotychczasowy lider, zaczął odstawać w kluczowych rankingach. Odpowiedzią Sama Altmana był wewnętrzny “Code Red” – pełna mobilizacja zasobów, wstrzymanie prac nad pobocznymi projektami (jak agenty zakupowe czy reklamy) i skupienie się wyłącznie na dowiezieniu topowej jakości modelu. 



Można przypuszczać, że wewnętrzny “Code Red”, o którym w ostatnich dniach spekulowano, okazał się czymś więcej niż motywacyjnym hasłem. Sam Altman podjął trudną decyzję biznesową: zepchnięcie na dalszy plan projektu “Operator” (autonomicznego agenta wykonującego zadania w przeglądarce) oraz wstrzymanie prac nad platformą reklamową. Cel był jeden: odzyskanie tronu lidera w benchmarkach, który w ostatnich tygodniach zaczął przejmować ekosystem Google. 

Zasoby inżynieryjne zostały przekierowane na dopracowanie architektury GPT-5.2. OpenAI uznało, że rynek nie potrzebuje teraz kolejnych gadżetów czy autonomii, lecz narzędzia o jeszcze wyższym stopniu logiki i zdolnościach analitycznych. 



GPT-5.2: Trio pod każde zadanie

OpenAI podzieliło nowość na trzy konkretne wersje, różniące się zastosowaniem. Jest to schemat dość podobny do tego, który mogliśmy zaobserwować przy okazji wdrożenia GPT-5.1. Przedstawia się on następująco: 

  • Instant: Lekki i bardzo szybki model do prostych pytań (np. “jaka jest pogoda”, “napisz maila” etc. Ma działać błyskawicznie.)
  • Thinking: Wersja “myśląca”. Zanim odpowie, analizuje problem krok po kroku. Zdecydowanie bardziej przeznaczona do działań matematycznych, logiki i planowania. 
  • Pro: Najpotężniejszy wariant do najcięższych zadań, dedykowany przede wszystkim programistom i firmom. 

Benchmark GDPval: AI w końcu lepsze od eksperta?

Najciekawszą daną z premiery wydaje się być wynik w nowym teście GDPval, który mierzy efektywność w 44 zawodach (od finansów po design). Zdaniem OpenAI, wersja “Thinking” osiągnęła 70,9%, pokonując lub dorównując ludzkim specjalistom w większości zadań. 

Co to oznacza w praktyce? OpenAI obiecuje, że model radzi sobie znacznie lepiej z:

  • Tworzeniem skomplikowanych arkuszy kalkulacyjnych i prezentacji.
  • Analizą długich dokumentów (bez gubienia wątku). 
  • Programowaniem (nowy rekord w benchmarku SWE-Bench Pro).

Disney wchodzi do gry

Na marginesie premiery technicznej, OpenAI zrzuciło jeszcze jedną bombę: partnerstwo z Disneyem. Gigant mediowy inwestuje 1 miliard dolarów w startup Altmana. Co więcej, postacie z Gwiezdnych Wojen, Pixara i Marvela mają trafić do generatora wideo Sora. Więcej na ten temat możecie przeczytać w tekście autorstwa Sylwii

Cóż, wydaje się, że premiera GPT-5.2 i “przyklepane” partnerstwo z Disneyem to solidne ciosy w policzek konkurencji, zarówno pod względem wizerunkowym, jak i biznesowym. 


Teraz pozostaje nam tylko czekać na dalszy rozwój tego “Technologicznego Ping-Ponga”.

źródło: OpenAI, TechCrunch

Piotr SojskiPołączenie pasji do nowych technologii i pisania to dla niego naturalny kierunek. Pamięta czasy, kiedy posiadanie telefonu komórkowego było luksusem. Obecnie skupia się na ekosystemie Apple.