OpenAI predstavio novi ChatGPT model. Tvrdi da je najbolji dosad

Ilustracija: Shutterstock

Tvrtka OpenAI danas je predstavila GPT-5.2, opisujući novi sustav kao svoj dosad najsposobniji model umjetne inteligencije i pozicionirajući ga kao najjači alat tvrtke za svakodnevni profesionalni rad.

Prema navodima tvrtke, GPT-5.2 pruža poboljšane performanse u izradi proračunskih tablica i prezentacija, tumačenju slika, pisanju softvera te upravljanju dugim i složenim unosima. Model se odmah dodaje u ChatGPT i OpenAI-jev API za programere.

Utrka s konkurencijom

Predstavljanje dolazi samo nekoliko tjedana nakon što je OpenAI izdao GPT-5.1, u trenutku dok se tvrtka suočava sa žestokom konkurencijom drugih velikih AI razvojnih tvrtki, uključujući Anthropic i Google. Njihova nedavna ažuriranja modela potaknula su OpenAI da preusmjeri interne resurse na unapređenje ChatGPT-a, potez koji su rukovoditelji opisali kao napor prioritetizacije pod "crvenim alarmom".

Fidji Simo, izvršna direktorica za aplikacije u OpenAI-ju, izjavila je da je interna direktiva imala za cilj usmjeriti pažnju tvrtke na jedan prioritet.

"To je bio način da se razjasni što treba biti na prvom mjestu, a što može pričekati", rekla je novinarima, dodajući kako vrijeme lansiranja novog modela nije bilo uvjetovano tom promjenom fokusa.

Izvršni direktor OpenAI-ja Sam Altman u zasebnom je intervjuu rekao da je izdanje Googleovog modela Gemini 3 u konačnici imalo manji utjecaj na korisničke metrike OpenAI-ja nego što se tvrtka u početku bojala. Rekao je kako očekuje da će tvrtka završiti svoje razdoblje "crvenog alarma" do siječnja.

Tri varijante i vrhunske performanse

GPT-5.2 bit će ponuđen u tri varijante. 'Instant' je dizajniran za brze odgovore i jednostavne zadatke pisanja; 'Thinking' je namijenjen složenom, strukturiranom radu poput kodiranja ili planiranja; a 'Pro' je predviđen za scenarije koji zahtijevaju najvišu točnost.

OpenAI je objavio da GPT-5.2 predvodi u nekoliko ključnih mjerila, uključujući SWE-Bench Pro, koji ocjenjuje autonomne sustave za kodiranje, te GPQA Diamond, test naprednog znanstvenog zaključivanja. U svojoj GDPval evaluaciji - internoj mjeri objavljenoj ranije ove godine - tvrtka je navela da je model bio jednak ili bolji od vodećih stručnjaka iz industrije u više od 70% dobro definiranih zadataka.

Dugotrajan razvoj i tržišna pozicija

"Ove nadogradnje razvijale su se mjesecima", rekla je Simo, ističući brz tempo izdanja modela, ali i naglašavajući da je integracija koja stoji iza GPT-5.2 bila dugotrajan napor.

Novootkriveni Opus 4.5 tvrtke Anthropic nadmašuje GPT-5.2 na SWE-Bench Verified, odvojenom mjerilu za kodiranje, no iz OpenAI-ja tvrde da je taj test uži i manje reprezentativan za stvarnu upotrebu od SWE-Bench Pro.

OpenAI, osnovan prije deset godina kao istraživački laboratorij, izrastao je u jednog od najkorištenijih svjetskih AI razvojnih programera od debija ChatGPT-a 2022. godine. Tvrtka navodi da više od 800 milijuna ljudi koristi njihov chatbot svaki tjedan.

Komentare možete pogledati na ovom linku.

Pročitajte više

 
Komentare možete pogledati na ovom linku.