ChatGPT-5.2 i tajemniczy „Code Red”. Co pokazał Altman?

Jeszcze w listopadzie sytuacja w OpenAI była napięta. Premiera Gemini 3 od Google sprawiła, że ChatGPT, dotychczasowy lider, zaczął odstawać w kluczowych rankingach. Odpowiedzią Sama Altmana był wewnętrzny “Code Red” – pełna mobilizacja zasobów, wstrzymanie prac nad pobocznymi projektami (jak agenty zakupowe czy reklamy) i skupienie się wyłącznie na dowiezieniu topowej jakości modelu.

Można przypuszczać, że wewnętrzny “Code Red”, o którym w ostatnich dniach spekulowano, okazał się czymś więcej niż motywacyjnym hasłem. Sam Altman podjął trudną decyzję biznesową: zepchnięcie na dalszy plan projektu “Operator” (autonomicznego agenta wykonującego zadania w przeglądarce) oraz wstrzymanie prac nad platformą reklamową. Cel był jeden: odzyskanie tronu lidera w benchmarkach, który w ostatnich tygodniach zaczął przejmować ekosystem Google.

Zasoby inżynieryjne zostały przekierowane na dopracowanie architektury GPT-5.2. OpenAI uznało, że rynek nie potrzebuje teraz kolejnych gadżetów czy autonomii, lecz narzędzia o jeszcze wyższym stopniu logiki i zdolnościach analitycznych.

GPT-5.2: Trio pod każde zadanie

OpenAI podzieliło nowość na trzy konkretne wersje, różniące się zastosowaniem. Jest to schemat dość podobny do tego, który mogliśmy zaobserwować przy okazji wdrożenia GPT-5.1. Przedstawia się on następująco:

Instant: Lekki i bardzo szybki model do prostych pytań (np. “jaka jest pogoda”, “napisz maila” etc. Ma działać błyskawicznie.)
Thinking: Wersja “myśląca”. Zanim odpowie, analizuje problem krok po kroku. Zdecydowanie bardziej przeznaczona do działań matematycznych, logiki i planowania.
Pro: Najpotężniejszy wariant do najcięższych zadań, dedykowany przede wszystkim programistom i firmom.

Benchmark GDPval: AI w końcu lepsze od eksperta?

Najciekawszą daną z premiery wydaje się być wynik w nowym teście GDPval, który mierzy efektywność w 44 zawodach (od finansów po design). Zdaniem OpenAI, wersja “Thinking” osiągnęła 70,9%, pokonując lub dorównując ludzkim specjalistom w większości zadań.

Co to oznacza w praktyce? OpenAI obiecuje, że model radzi sobie znacznie lepiej z:

Tworzeniem skomplikowanych arkuszy kalkulacyjnych i prezentacji.
Analizą długich dokumentów (bez gubienia wątku).
Programowaniem (nowy rekord w benchmarku SWE-Bench Pro).

Disney wchodzi do gry

Na marginesie premiery technicznej, OpenAI zrzuciło jeszcze jedną bombę: partnerstwo z Disneyem. Gigant mediowy inwestuje 1 miliard dolarów w startup Altmana. Co więcej, postacie z Gwiezdnych Wojen, Pixara i Marvela mają trafić do generatora wideo Sora. Więcej na ten temat możecie przeczytać w tekście autorstwa Sylwii.

Cóż, wydaje się, że premiera GPT-5.2 i “przyklepane” partnerstwo z Disneyem to solidne ciosy w policzek konkurencji, zarówno pod względem wizerunkowym, jak i biznesowym.

Teraz pozostaje nam tylko czekać na dalszy rozwój tego “Technologicznego Ping-Ponga”.

źródło: OpenAI, TechCrunch

Photoshop stał się darmowy. ChatGPT zyskał supermoce

AI ChatGPT OpenAI sztuczna inteligencja

OpenAI kontratakuje. GPT-5.2 to bezpośrednia odpowiedź na mobilizację w Google

GPT-5.2: Trio pod każde zadanie

Benchmark GDPval: AI w końcu lepsze od eksperta?

Disney wchodzi do gry