OpenAI lanserer GPT-5.5: smartere og mer selvstendig

Kort fortalt

OpenAI lanserte GPT-5.5 den 24. april 2026, og kaller den sin smarteste modell hittil. Det viktigste er ikke bare at modellen er smartere. Påstanden er at GPT-5.5 kan ta en rotete oppgave med mange deler, og planlegge den, bruke verktøy, sjekke sitt eget arbeid og fortsette helt til den er ferdig. Den slipper å stoppe etter hvert steg for å spørre hva den skal gjøre videre.

Modellen er nå tilgjengelig for betalende ChatGPT-brukere (Plus, Pro, Business og Enterprise) og inne i Codex, OpenAIs verktøy for koding. En kraftigere variant kalt GPT-5.5 Pro er tilgjengelig for Pro-, Business- og Enterprise-brukere. API-et (grensesnittet utviklere bruker for å snakke med modellen fra egne programmer) kommer snart. I API-et starter prisen på 5 dollar per million input-tokens.

Les også:

Hva er nytt

OpenAI presenterer GPT-5.5 mindre som «ChatGPT, men smartere», og mer som en modell bygd for å gjøre arbeid på en datamaskin. Lanseringsteksten samler forbedringene i tre områder. Det er verdt å ta dem én etter én.

Koding som faktisk fullfører

GPT-5.5 er OpenAIs sterkeste kodemodell hittil. Den oppnår 82,7 prosent på Terminal-Bench 2.0, opp fra 75,1 prosent for GPT-5.4. Dette er en test som måler hvor godt en modell håndterer komplekse arbeidsflyter på kommandolinjen (det rene tekstgrensesnittet utviklere bruker for å styre en datamaskin). På SWE-Bench Pro, som måler løsing av faktiske GitHub-saker, når den 58,6 prosent.

Bortsett fra tallene: det de tidlige testerne beskriver er en annen type hjelp. Erfarne utviklere sier GPT-5.5 fanger opp problemer før de skjer, forutser hvilke tester og gjennomganger som trengs, og holder seg på en oppgave mye lenger uten å gi opp. En NVIDIA-utvikler sa at det å miste tilgangen til den «føles som om jeg har fått amputert et lem».

Et konkret eksempel fra annonseringen: en utvikler ba GPT-5.5 om å bygge om kommentarsystemet i et samarbeidsverktøy. Modellen kom tilbake med tolv kodeendringer som var «nesten ferdig». Slikt arbeid med mange filer og mange steg har vært det svake punktet for AI-kodeassistenter helt frem til nå.

Datamaskinarbeid, ikke bare prat

De samme egenskapene som gjør GPT-5.5 god på kode, gjør den også nyttig for vanlig kunnskapsarbeid: finne informasjon, bygge dokumenter og regneark, veksle mellom apper, sjekke resultater og gjøre et rotete utgangspunkt om til noe brukbart.

OpenAI sier at mer enn 85 prosent av deres egne ansatte bruker Codex hver uke, i roller som finans, marked og kommunikasjon. Eksempler fra lanseringen: økonomiavdelingen brukte den til å gå gjennom 24 771 skatteskjemaer (71 637 sider). En salgsmedarbeider automatiserte de ukentlige forretningsrapportene og sparte 5 til 10 timer i uken.

I selve ChatGPT er den nye GPT-5.5 Pro-varianten laget for vanskeligere spørsmål, der nøyaktighet og dybde betyr mest: forretningsanalyse, juridisk arbeid, utdanning og dataanalyse.

Vitenskapelig forskning

Det mest slående eksempelet i annonseringen er matematisk. En intern versjon av GPT-5.5 hjalp til med å finne et nytt bevis om Ramsey-tall. Dette er et gammelt problem innen kombinatorikk, en gren av matematikken som studerer hvordan ulike objekter kan settes sammen i mønstre. Beviset ble senere bekreftet i Lean, et programmeringsspråk laget for å sjekke matematiske bevis med datamaskin.

OpenAI rapporterer også fremgang på ytelsestester for biologi og bioinformatikk. Der kan GPT-5.5 angivelig ta på seg analyseoppgaver som tar flere dager, og som normalt krever ekspertforskere. OpenAI sier selv at modellen nå er sterk nok til å fungere som en «medforsker».

Samme fart, færre tokens

Større AI-modeller blir vanligvis tregere etter hvert som de blir smartere. GPT-5.5 er et unntak. OpenAI sier den er like rask som GPT-5.4 per token (tiden du venter mellom å sende en forespørsel og få et svar), samtidig som den er mye smartere. Den bruker også betydelig færre tokens (de små tekstbitene modellen leser og skriver) for å fullføre de samme Codex-oppgavene.

Mye av dette kommer fra maskinvaren. GPT-5.5 er designet for og trent på NVIDIA GB200- og GB300 NVL72-systemer. Det er store reoler med brikker som er spesialiserte for AI. OpenAI sier også at modellen og Codex selv ble brukt til å forbedre infrastrukturen som kjører dem. Et eksempel: skreddersydd kode for lastbalansering (som fordeler arbeidet jevnt mellom mange brikker) økte hastigheten på token-genereringen med over 20 prosent.

Konklusjonen: mer kapasitet per krone. På Artificial Analysis Coding Index, en uavhengig ytelsesprøve, leverer GPT-5.5 ledende ytelse til omtrent halve prisen av konkurrerende toppmodeller for koding.

Strammere cybersikkerhet

OpenAI klassifiserer evnene til GPT-5.5 innen biologi/kjemi og cybersikkerhet som High under deres Preparedness Framework. Dette er det interne graderingssystemet for hvor risikable en modells evner kan være. High er ett trinn under Critical, så modellen krysset ikke den alvorligste grensen. Men evnene innen cybersikkerhet er klart sterkere enn hos GPT-5.4.

OpenAI svarer på dette på to måter. På den ene siden innfører de strammere filtre for sensitive cyber-forespørsler, med ekstra beskyttelse mot gjentatt misbruk. Noen brukere vil få avvisninger de ikke har sett før.

På den andre siden utvider OpenAI tilgangen for verifiserte forsvarere. Et nytt program kalt Trusted Access for Cyber lar sikkerhetsteam søke om mindre begrensende modeller når de jobber med legitime forsvarsoppgaver. Aktører som drifter kritisk infrastruktur (strømnett, vannforsyning, offentlige registre) kan også søke om en enda friere modell kalt GPT-5.4-Cyber.

Pris og tilgjengelighet

I ChatGPT og Codex følger GPT-5.5 med i de betalte abonnementene. Codex har nå et kontekstvindu på 400 000 tokens. Det betyr at modellen kan holde så mange tokens i minnet samtidig (omtrent like mye som en lang roman).

I API-et koster GPT-5.5 5 dollar per million input-tokens og 30 dollar per million output-tokens. Kontekstvinduet er på 1 000 000 tokens. GPT-5.5 Pro er betydelig dyrere på 30 dollar per million input og 180 dollar per million output. Den er rettet mot oppgaver der nøyaktighet er verdt prisforskjellen. Batch- og Flex-priser ligger på halv standardpris.

Det større bildet

GPT-5.5 i seg selv er en gradvis forbedring fra GPT-5.4. Det interessante skiftet er hva OpenAI legger vekt på i annonseringen. Modellen presenteres mindre som et verktøy for å svare på spørsmål, og mer som noe som kan utføre arbeid på en datamaskin over tid. Planlegge, bruke verktøy, sjekke arbeidet, prøve på nytt, fullføre.

Det er retningen hele bransjen har pekt mot det siste året. Det er det folk nå kaller agentisk AI. Avveiningene er også kjente: mer selvstendighet gir mer evne til legitimt arbeid, mer risiko hvis modellen misbrukes, og mer press på sikkerhetsmekanismene. Med GPT-5.5 satser OpenAI på alle tre samtidig.

Ordliste

Begrep	Forklaring
Agentisk AI	AI som planlegger, bruker verktøy og fullfører en oppgave selv, i stedet for bare å svare på ett spørsmål av gangen.
Token	En liten tekstbit som en språkmodell leser og skriver. Et token er omtrent noen tegn eller et kort ord.
Kontekstvindu	Hvor mange tokens en modell kan holde i minnet samtidig under en samtale eller oppgave.
Responstid (latency)	Hvor lenge du venter mellom å sende en forespørsel og å få svar tilbake.
Codex	OpenAIs produkt for koding, der modellene gjør praktisk utviklingsarbeid som å skrive, feilsøke og bygge om kode.
Benchmark	En standardisert test som måler hvor godt en modell presterer på en bestemt oppgave, brukt for å sammenligne modeller.
Preparedness Framework	OpenAIs interne graderingssystem for hvor risikable en modells evner er, med nivåer som High og Critical.