Bygg et team av AI-agenter

Dette er et AI-generert sammendrag. Kildevideoen kan inneholde demonstrasjoner, visuelt innhold og ytterligere kontekst.
Kort fortalt
En frittstående AI-modell kan ikke bygge en mobilapp alene. Den kan skrive én funksjon, svare på ett spørsmål, men komplekse oppgaver krever team av samarbeidspartnere. Lauren McHugh Olende fra IBM Technology forklarer at å bygge et team av AI-agenter ligner overraskende mye på å bygge et team av mennesker: du trenger planleggere, utførere, kritikere og formidlere. Videoen kartlegger syv roller og fire virkemidler for å gjøre hver rolle god.
Les også:
Rollene i agentteamet
Videoen stiller to spørsmål som styrer alt: hvilke roller trenger agenten, og hvordan gjør du hver rolle spesielt god på jobben sin? Her er de syv rollene:
| Rolle | Hva den gjør | Menneskelig analog |
|---|---|---|
| Doer (utfører) | Utfører enkeltoppgaver som å skrive eller kode | Juniormedarbeider |
| Planner (planlegger) | Bryter ned store oppgaver i håndterbare steg | Prosjektleder |
| Tool operator (verktøyoperatør) | Kaller API-er og eksterne tjenester | Driftsspesialist |
| Learner (utforsker) | Henter relevant informasjon fra omverdenen | Forsker |
| Critic (kritiker) | Kvalitetssjekker output og fanger feil | QA-ansvarlig |
| Supervisor (veileder) | Passer på at ingen henger seg opp | Teamleder |
| Presenter (presentatør) | Samler resultater og rapporterer til brukeren | Kommunikasjonsansvarlig |
Utføreren finnes i alle agentsystemer. Den gjør konkrete ting, men alene kan den ikke løse komplekse oppgaver. Den trenger noen som ser helheten.
Planleggeren tar imot oppgaven fra brukeren og lager en plan. I mobilapp-eksemplet fra videoen betyr det to planleggingssteg: ett for brukerbehovene og ett for apparkitekturen, før en linje kode er skrevet. Rollen er å bryte ned et komplekst problem i deler som utførerne kan håndtere.
Verktøyoperatøren kaller på API-er (programmeringsgrensesnitt der systemer snakker med hverandre), skript og webtjenester. Den lager strukturerte verktøykall med riktige argumenter og sender resultatene videre i kjeden.
Utforskeren er agentens forskerrolle. Den henter informasjon utenfra: om konkurrentenes apper, brukerbehov fra blogger og sosiale medier, markedstrender. Dette er ofte et RAG-oppsett (retrieval-augmented generation, en teknikk der agenten henter info fra eksterne kilder), men kan også være regelbasert datahenting.
Kritikeren sjekker om outputen er god nok. Den kan sjekke svar for hallusinasjoner (tilfeller der modellen dikter opp noe og presenterer det som fakta), skrive og kjøre tester på generert kode, eller score flere svar og velge det beste.
Veilederen overvåker på oppgavenivå eller prosjektnivå. Den sjekker om roller setter seg fast, identifiserer steg som feiler og holder prosessen i gang.
Presentatøren setter delene sammen og formidler resultatet til brukeren. I mobilapp-eksemplet oppsummerer den brukerbehovene, forklarer kodebasen og presenterer den ferdige appen.
ReAct: fire roller i ett mønster
ReAct-mønsteret (kort for Reasoning + Acting) er en populær kombinasjon av fire av rollene og et vanlig startpunkt for enkle agentsystemer:
| ReAct-steg | Agentrolle |
|---|---|
| Reasoning (resonering) | Planlegger |
| Action (handling) | Verktøyoperatør |
| Observe (observasjon) | Kritiker |
| Answer (svar) | Presentatør |
De fire henger sammen i en sløyfe: planleggeren tenker, verktøyoperatøren handler, kritikeren observerer resultatet, og presentatøren formidler svaret. Enkelt nok til å komme raskt i gang, skalerbart nok til å bygge videre på.
Slik gjør du en rolle god
Å ha riktige roller er bare halve jobben. Her er de fire virkemidlene:
Prompting er det første steget. Gi instruksjoner slik du ville gitt dem til et menneske. Noe så enkelt som "hvis du setter deg fast, prøv på nytt" kan hjelpe en agent gjennom vegger den ellers ville stoppet ved.
Modellvalg handler om å ansette riktig person fra starten. Ikke alle modeller passer alle roller. Spesialisering, modellstørrelse, om den er en tenkende modell, og modellens karakter er faktorer som spiller inn.
Finjustering (fine-tuning) betyr å gi modellen eksempler på hva godt arbeid ser ut i den rollen. Mer ressurskrevende, men gir mer målrettet atferd.
Kontekst handler om å gi agenten tilgang til riktige systemer, filer og databaser, uten å overvelde den med irrelevant informasjon. Tenk på det som god onboarding: gi nytilsatte akkurat det de trenger, ikke alt på en gang.
Starte smått, vokse etter behov
En oppstart kan lansere med noen få smarte folk og løse et enklere problem. Et agentsystem starter på samme måte: noen få kjerneroler, en fungerende løsning. Etter hvert vokser teamet med flere roller, mer spesialisering og sterkere kvalitetskontroll. Logikken er den samme enten det er mennesker eller subagenter.
Ordliste
| Begrep | Forklaring |
|---|---|
| Subagent | En spesialisert agent som er del av et større agentsystem |
| ReAct-mønsteret | Sammensatt av Reasoning + Acting. Standardarkitektur med fire roller: Reasoning (planlegger), Action (verktøyoperatør), Observe (kritiker) og Answer (presentatør) |
| RAG (retrieval-augmented generation) | Teknikk der en agent henter relevant informasjon fra eksterne kilder før den svarer |
| Finjustering (fine-tuning) | Å trene en modell videre på eksempler for å gjøre den bedre på en spesifikk oppgave |
| API (application programming interface) | Programmeringsgrensesnitt der systemer snakker med hverandre, som en standardisert dør mellom to programmer |
| Hallusinasjon | Når en AI-modell dikter opp noe og presenterer det som fakta |
Kilder og ressurser
Vil du vite mer? Se hele videoen på YouTube →