Om språk og intelligens

Bokas titteldikt er en kritikk av det «alle» mener er så viktig i dag: AI. Vel, de fleste sier vel KI, men jeg holder fast ved den gamle betegnelsen (hentet fra engelsk).

Men før jeg utbroderer kritikken en smule er det vel på sin plass å bekjentgjøre min AI-plattform:

  • tidligere styremedlem i NAIS (norsk AI-forening)
  • tidligere eneredaksjon for NAIM (norsk AI-magasin) som jeg løftet fra en 4-siders A5 til drøyt 50 sider A4
  • arrangør av første SCAI (scandinavian conference on AI; 1988)
  • styremedlem ECCAI (den europeiske paraplyorganisasjonen for nasjonale AI-foreninger

Alt dette, og mere til, er vann som forlengst har rent ut i havet og er fordampet.

Dagens oppjagede stemning rundt AI dreier seg egentlig bare om en bit av hva som kunne vært intelligens. Og det aller meste som beskrives som AI er svært lite intelligent. Likevel løper media, influensere og kreti og pleti i flokk. Mye godt fordi det drysser finansiering ut fra ulike kilder.

Diktet tar for seg LLM («large language models»; store språkmodeller) som ligger bak slikt som ChatGPT. Og jo mer jeg sjekket ut skriverier om LLM, jo mer skeptisk ble jeg. Fordi et levende språk er mer komplisert enn de regnestykkene som LLM-produktene klarer å levere. For meg finnes det stier og veier gjennom ethvert språk som vi tenkende kan utforske. Og vi kan tråkke opp nye stier som de ikke-intelligente LLM-produktene klarer å snuse seg frem til.

«Språkets stier» ble til en kveld sist vinter. Lenge før det jeg kaller AI-skandalen i Tromsø. Sånt sett kunne kanskje diktet fungert som et tidlig varsel om hvor feil det kan gå når man ikke tar innover seg svakhetene ved LLM og det problematiske ved å stole på slik mangelfull intelligens.

Min liste over ankepunkter er lenger enn jeg ønsker. Men la meg kort beskrive noen få:

  1. Uansett hvor omfattende tekstgrunnlaget i en LLM er, så vil det alltid være hull i dens «kunnskap». Og dette er hull den selv ikke er i stand til å tette igjen.
  2. Som brukere har vi ikke tilgang til å bedømme kildegrunnlaget, dvs tekstene og opphavet til disse. Dermed kan vi heller ikke bedømme kvalitet.
  3. Som brukere vet vi ikke om en LLM har innebygd katalogisering av kilder som f.eks førstehånds, annenhånds, meta-tekster (omtale av tekster) osv. Alt blandes sammen i samme base med minimal meta-tagging.
  4. Det er i de fleste tilfeller forbausende lett å styre LLMens svar i den retningen man selv ønsker. Dette er den samme bekreftelsestendensen man dessverre ser alt for ofte også i andre sammenhenger. Det er menneskelig å søke informasjon som støtter ens egne synspunkter. Og: det er menneskelig å feile. Ut fra dette bør man kunne se at det også er mulig å lage produkter som feiler.
  5. Når LLMer mates med tekster skapt ved hjelp av LLM så vil svakhetene forsterkes. Særlig når slike LLM-tekster benyttes på samme måte som originaltekster. Dette gir en utvanning av «ekte» tekster lik utvanning av virkestoffer i homeopati.
  6. LLM-tekstene er ikke skapt gjennom prosesser som kan kalles tenkning eller intelligens. Å hevde at dette er intelligens er en overforenkling. De stiene i språk som skapes gjennom bruk av LLM er ganske enkelt statistikk og sannsynlighetsberegning der neste ord og neste utsagn er et resultat av hva de «innlærte» tekstene har gitt mht. frekvens og rekkefølge.

Hvis noen da skulle få for seg at de vil mate en LLM med min poesi så vil jeg bare legge til et «jungelordtak» jeg selv har skapt helt uten bruk av teknologi. At ordtaket er på engelsk skal jeg få lov til å begrunne senere:

That’s how my model became a muddle!

Boka er å finne hos bokhandlere og enkelte bibliotek.

Spør gjerne din lokale bokhandel eller bibliotekt dersom den ikke er i hylla.