Claude Code lekket: hemmeligheten er ikke AI-en

Nøkkelinnsikt
- Å bygge AI-agenter er 80 prosent grunnarbeid og 20 prosent AI. De fleste team hopper over grunnarbeidet og lurer på hvorfor demoen krasjer når den tas i bruk i virkeligheten.
- Oppgavestatus og samtalehistorikk er to forskjellige ting. Å gjenopprette en chat betyr ikke at oppgaven fortsetter der den slapp. Agenten kan fortsatt sende doble meldinger eller gjenta dyre operasjoner etter et krasj.
- Claude Code velger selv hvilke verktøy den trenger fra 184 tilgjengelige, i stedet for å bruke én fast liste per agent.
- Den vanligste feilen i agentprosjekter er å gjøre det for komplisert, ikke for enkelt. Team bygger samarbeid mellom flere agenter før systemet i det hele tatt tåler et enkelt krasj.
Dette er et AI-generert sammendrag. Kildevideoen kan inneholde demonstrasjoner, visuelt innhold og ytterligere kontekst.
Kort fortalt
Anthropic lekket ved et uhell kildekoden til Claude Code, et produkt med en omsetning på 2,5 milliarder dollar. Lekkasjen viste hele den interne oppbygningen: verktøyoversikter, tillatelsessystemer, lagring av sesjoner og seks innebygde agenttyper. Mens de fleste så på dette som en spennende kikk på nye funksjoner, gikk Nate B Jones dypere og fant 12 grunnleggende byggeklosser fordelt på tre nivåer. Enkle og lite synlige valg som gjør at Claude Code faktisk fungerer stabilt i stor skala.
Les også:
Alle så på feil ting
To store lekkasjer fra Anthropic på én uke. Ikke én. To. Nate peker på noe viktig: går utviklingen nå så fort at kontrollen ikke henger med?
Anthropic sier selv at de skriver 90 prosent av koden sin med hjelp av AI. Ingeniørene leverer opptil fem versjoner hver per dag. Det går fort. Og når ting går fort, øker risikoen for feil. Da lekkasjen skjedde, på grunn av en feil i byggekonfigurasjonen som gjorde koden offentlig tilgjengelig, spredte en teori seg raskt på X: at en AI-modell ved et uhell hadde sendt inn filen som ble lekket.
Om det stemmer eller ikke, er egentlig ikke det viktigste. Det interessante er at det høres helt realistisk ut. Ikke rart. Ikke usannsynlig. Bare noe som godt kunne ha skjedd. Det sier mye om hvordan systemer bygges i dag.
De fleste fokuserte på hva som kommer av nye funksjoner. Nate så på noe annet: hva er det som gjør at dette faktisk fungerer i praksis?
Svaret: ikke funksjoner. Men grunnarbeid.
De 12 byggeklossene: det ingen snakker om
Claude Code er bygget opp av 12 grunnleggende byggeklosser, fordelt på tre nivåer. De åtte første er ting som må være på plass fra starten. Ikke etterpå. Ikke "vi fikser det senere".
Byggekloss 1: Verktøyregister (tool registry). Claude Code har to oversikter: én liste med 207 kommandoer for brukeren, og én liste med 184 verktøy som modellen kan bruke. Tenk på det som en verktøykasse med etiketter på alt før du begynner å jobbe. Uten en slik oversikt må du endre hele systemet hver gang du legger til noe nytt.
Byggekloss 2: Tillatelsesnivåer (permission tiers). Ikke alle verktøy er like trygge. Claude Code deler dem inn i tre nivåer: innebygde (trygge), tillegg (middels risiko) og brukerlagde (lavest tillit). Bash-verktøyet, som lar systemet kjøre kommandoer, har alene en sikkerhetsløsning med 18 deler. Tenk på det som flere låser på én dør. Ikke fordi det er overdrevet, men fordi konsekvensene kan være store.
Nate sier det slik:
"En sikkerhetsløsning med 18 deler for ett verktøy. Det er ikke overdrevet. Det er det som skiller et trygt system fra et som bare fungerer i liten skala."
Grensen er enkel: Hvis agenten din kan gjøre ting i virkeligheten uten kontroll, har du ikke et produkt. Du har en demo.
Byggekloss 3: Lagring av sesjon (session persistence). Agenter krasjer. Hele tiden. Nettet faller ut. Faner lukkes. Claude Code lagrer hele sesjonen som en fil: samtaler, valg, bruk og innstillinger. Tenk på det som autosave i et spill. Når noe går galt, kan du fortsette der du var.
Byggekloss 4: Oppgavestatus (workflow state). Dette er en klassisk felle. Samtalen husker hva som er sagt. Oppgaven husker hva som er gjort. Det er to forskjellige ting. Hvis du bare har samtalen, vet du ikke hvor du er i prosessen.
Som å spille et spill uten lagring av progresjon: du husker hva du gjorde, men ikke hvor langt du kom.
"Hvis du ikke har oppgavestatus, kan du starte agenten på nytt akkurat der den var, men den husker ikke automatisk hvor den var i oppgaven, fordi oppgaven er noe som lever utover agenten selv."
Uten oppgavestatus kan agenten gjøre ting to ganger, bruke penger på nytt eller ødelegge data. Det er ikke bare et krasj. Det er en reell feil.
Byggekloss 5: Tokenbudsjett (token budget). Systemet setter grenser for hvor mye tekst som kan brukes. Før noe kjøres, sjekkes det om det går over grensen. Hvis ja, stoppes det. Litt som å ha en maksgrense på bankkortet.
Byggekloss 6: Strømmehendelser (streaming events). Mens agenten jobber, sendes det løpende oppdateringer. Ikke bare tekst, men hva som faktisk skjer. Hvilke verktøy vurderes? Hva er status? Hvis noe krasjer, sendes en feilmelding med årsak. Som en svart boks i et fly.
Byggekloss 7: Systemlogging. En egen logg som viser hva som faktisk ble gjort, ikke bare hva som ble sagt. Hvilke verktøy ble brukt? Hva ble godkjent? Hva ble avvist? Dette gjør det mulig å gå tilbake og forstå alt i etterkant.
Byggekloss 8: Verifisering. To nivåer. Først: sjekke at jobben ble gjort riktig. Deretter: sjekke at systemet fortsatt er trygt etter endringer. Litt som å teste både svaret og selve kalkulatoren.
Operasjonell modenhet: de avanserte byggeklossene
Når grunnmuren er på plass, kommer neste nivå.
Byggekloss 9: Verktøyvalg (tool pool assembly). Agenten får ikke alle verktøy samtidig. Den får bare det den trenger. Som å velge riktig verktøy før du begynner, i stedet for å ta med hele verktøykassa hver gang.
Byggekloss 10: Sammentrekking av samtaler (transcript compaction). Gamle meldinger kortes ned. Det viktigste beholdes. Resten fjernes. Hvis ikke, blir systemet tregt og dyrt.
Byggekloss 11: Tillatelsessporing (permission audit trail). Alle valg logges. Ikke bare ja eller nei, men hvorfor. Claude Code håndterer dette forskjellig avhengig av om et menneske er med, flere agenter jobber sammen, eller systemet kjører selv.
Byggekloss 12: Agentsystemet. Claude Code deler agentene inn i seks roller: utforske, planlegge, verifisere, veilede, generell og status. Hver rolle har klare begrensninger. Det er som et lag der alle har faste oppgaver. Ikke alle gjør alt.
80 prosent grunnarbeid
Nates siste poeng er enkelt:
"Å bygge agenter er 80 prosent grunnarbeid og 20 prosent AI."
Den vanligste feilen er å gå rett på det avanserte. Flere agenter. Kompleks logikk. Masse funksjoner. Men hvis grunnlaget ikke er på plass, faller alt sammen.
Claude Code er verdt 2,5 milliarder dollar. Ikke på grunn av en smartere AI. Men fordi det grunnleggende fungerer: kontroll, sikkerhet, lagring og tydelige roller.
Det er ikke spesielt spennende.
Men det er det som gjør at det faktisk virker.
Ordliste
| Begrep | Forklaring |
|---|---|
| Verktøyregister (tool registry) | En oversikt over alle verktøy en AI-agent kan bruke, med navn og beskrivelser, før noe verktøy faktisk kalles |
| Tillitsnivå (permission tier) | En måte å dele verktøy inn etter hvor trygge de er: trygge kjøres fritt, farlige krever godkjenning |
| Lagring av sesjon (session persistence) | Å lagre hele tilstanden til en AI-sesjon slik at systemet kan fortsette etter en feil |
| Oppgavestatus (workflow state) | En oversikt over hvor langt en oppgave har kommet og hva som er gjort, adskilt fra samtalehistorikken |
| Tokenbudsjett (token budget) | En grense for hvor mye tekst AI-en kan bruke før kjøringen stoppes |
| Sammentrekking av samtale (transcript compaction) | Å korte ned gamle meldinger for å spare plass, mens det viktigste beholdes |
| Agentsystemet | Faste roller for agenter (utforsker, planlegger, verifiserer osv.) med klare begrensninger |
| Verktøyvalg (tool pool assembly) | Å velge riktige verktøy basert på situasjonen, i stedet for å gi agenten alt samtidig |
| Strømmehendelser (streaming events) | Løpende oppdateringer om hva agenten gjør mens den jobber |
Kilder og ressurser
Vil du vite mer? Se hele videoen på YouTube →