9. juni 2023

Kampen om kontrol af kunstig intelligens er afgørende

AI

Kunstig intelligens har et enormt potentiale, men kan også koncentrere magten endnu mere hos de firmaer eller nationer, der bliver førende. Det er også en stor udfordring for Europa.

Kronik i Politiken den 9. juni 2023. Af Anders Søgaard (professor, KU), Sune Lehmann (professor, DTU og KU), Rebecca Adler-Nissen (professor, KU), Ole Winther (professor, DTU og KU) og Michael Bang Petersen (professor, Aarhus Universitet).

VIDEN ER, SOM Francis Bacon har påpeget, magt. Og viden driver økonomisk vækst. I dag har internettet gjort data mere tilgængelig end nogensinde før. Det bliver tit beskrevet som en demokratisering af viden, som - skulle man tro - bragte lighed med sig.

Men magten har forrykket sig. I dag er det i høj grad de virksomheder, der styrer, hvordan du navigerer i informationshavet, som har magten. De, der leder os til en bestemt information og former den, så den ligner en viden, vi ønsker. Og omsætter den til handling i stor skala.

Data giver indsigt i kundeadfærd og markedstendenser og kan fødes direkte ind i virksomheders forretningsstrategier og anvendes til at udvikle nye produkter og tjenester. Data kan også bruges i politikernes og meningsdannernes forsøg på at trække befolkningen i en bestemt retning.

I en verden, hvor information er alment tilgængelig, og det globale marked ligger mere eller mindre åbent for alle, søger vi ironisk nok allesammen viden de samme steder.

Indtil for nylig var Google et eksempel på, hvordan der ofte kun er plads til én vinder i vidensøkonomien: ‘The winner takes it all.' Der er grund til at tro, at det samme gør sig gældende for sprogmodeller og chatbots. Den største spiller høster mest data, har mest indflydelse på infrastruktur og tiltrækker den dygtigste arbejdskraft. Og udbygger langsomt forspringet.

KAPLØBET ER stadig åbent: Microsoft, Google/Alphabet, Facebook/Meta, Anthropic, Amazon, HuggingFace, Alibaba, Bytedance, Tencent og en række mindre virksomheder er med. Og gevinsten er stor: Værdien af det globale AI-marked blev i 2021 vurderet af Bloomberg til at være 60 milliarder dollars og forventes at nå næsten 500 milliarder dollars i 2028.

Hvem der bliver den nye Google, er altså et åbent spørgsmål, men mange fremhæver Google og Microsoft. De to virksomheder er et skridt foran.

Når vi bliver afhængige af andres teknologi eller ressourcer, bliver vi meget sårbare, som vi så det for nylig med russisk naturgas

Google har Google Search og et stærkt brand. Det at søge på nettet er for de fleste af os synonymt med at google noget. Googles chatbot Bard, baseret på sprogmodellen PaLM 2, supplerer - som GPT-4 i Microsofts søgemaskine, Bing - dine søgeresultater med egentlige svar. Google integrerer nu Bard i deres produkter, f.eks. Gmail og Assistant. Microsoft integrerer til gengæld deres sprogmodeller i deres Office-pakke.

Google og Microsoft bliver udfordret på tre fronter: andre virksomheder, open source-miljøer og regulering. Anthropic - en relativt ny virksomhed - rejste for nylig halvanden milliard dollars fra bl.a. Google til at træne endnu bedre og sikrere sprogmodeller. Alibaba er ved at integrere deres chatbot i en lang række af deres apps.

Omvendt ser vi også en masse open source-initiativer. Sprogmodeller er store og dyre i drift, men forskningsmiljøet har udviklet en række værktøjer til at reducere sprogmodellers størrelse og til mere effektivt at tilpasse dem. Lækkede dokumenter afslører, at de store techvirksomheder er meget bekymrede for konkurrence fra open source-miljøerne.

Men den største udfordring for techvirksomhedernes magtkoncentration kommer måske fra politikernes og borgernes krav om regulering.

I BRUXELLES arbejdes der på en ambitiøs AI-lovgivning, som vil gælde i hele EU. Og der er meget på spil. Corporate Europe Observatory har afsløret, hvordan techgiganter som Google og Microsoft har lobbyet for, at lovgiverne i Bruxelles holder deres sprogmodeller som Palm 2 og GPT-4 fri for de krav, der vil blive stillet til højrisiko AI. Og det på trods af, at det er de store virksomheder, som har lettest ved at håndtere nye regler, fordi de har flere ressourcer til omstilling og har adgang til bedre juridisk bistand.

Det er ikke kun et kapløb om data og penge, men også om kontrol over tilgangen til viden. I dag har sociale medier og søgemaskiner stor indflydelse på vores tilgang til viden, men en stor del af indholdet bliver produceret på brugerdrevne platforme som Reddit, Stack Overflow og Wikipedia og på fondsdrevne som lex.dk. Disse platforme udfordres, for vi 'udsulter' dem, når vi i stedet bruger chatbots.

Chatbots er naturligvis trænet på data fra brugerdrevne platforme, men også i stigende grad på internt og syntetisk data, og der er ingen garanti for, hvilke dele af de brugerdrevne platformes indhold der promoveres af chatbots.

RESULTATET kan blive en ekstrem asymmetri, hvor viden genereres af den eller de chatbots, som vinder markedet. Det betyder, at de dominerende chatbots får endnu mere viden om os, fordi de allerede har vores mails, kalendere og fotos - data, som ikke er på det åbne internet.

De kan altså mikrosegmentere på helt nye måder, hvilket ikke blot øger risikoen for, at vi bliver manipuleret, men også for, at den information, der er tilgængelig for os, bliver ensidig og monokulturel. Internettet holder op med at være et netværk og bliver i stedet til et system, hvor hver enkelt bruger sidder - som for enden af eger i et cykelhjul - direkte forbundet til sprogmodellen i centrum.

Google og Microsoft er amerikanske. Alibaba er kinesisk. I Rusland er Yandex en stor udvikler af sprogmodeller. Sprogmodeller er blevet delt på kryds og tværs de sidste tyve år. Af både forskere og firmaer. Flere af både Googles og Yandex' sprogmodeller ligger frit tilgængelige, men siden november sidste år har flere firmaer lukket sig lidt mere om sig selv - fordi kapløbet spidser til.

Hvilken betydning vil det have for os, hvem vinder kapløbet? Selv i en åben verden gør det en stor forskel. Bard, GPT-4 og Yandex' sprogmodeller køres på servere uden for Europa.

Offentlige institutioner og virksomheder er derfor begrænsede i deres brug af dem. Meget data må ikke sendes ud af EU. Der er også stor forskel på, hvilke krav der stilles til sprogmodeller rundt omkring i verden.

AI-forordningen vil stille krav til modeller, der opererer i EU. I USA er en tilsvarende lovgivning på vej, men der er mange forskelle.

I Kina har man besluttet sig for en lovpakke, der blandt andet kræver, at sprogmodeller ikke producerer antisocialistisk eller statsundergravende indhold. Endelig vil sprogmodellerne være trænet på forskellige data og interaktioner med forskellige brugere og dermed have forskellige biases.

Mange lovgivere får lyst til at klassificere kunstig intelligens, der anvendes til kritisk infrastruktur, som 'højrisiko

NOGLE MODELLER vil passe bedre til det danske marked end andre, og nogle vil dække vores behov mere ligeligt end andre. Og nogle lande kan tillade forskellige forretningsmodel

MENS VIRKSOMHEDER og lande slås om kontrollen over viden, er mange begyndt at stille spørgsmål til, hvad det egentlig er for en vare, de her virksomheder sælger?

En virksomhed, der sælger kartoffelchips, skaber værdi ved at tilberede kartofler, som de køber af landmænd. Google og Microsoft skaber værdi ved at komprimere og tilgængeliggøre viden, som brugere på platforme som Reddit, Stack Overflow og Wikipedia har givet dem gratis adgang til.

OpenAI og StabilityAI giver brugere adgang til værktøjer, der genererer visuelt indhold, men træner deres modeller på kunstværker uden at betale kunstnerne. Googles MusicLM, som på samme vis kan bruges til at skabe ny musik ud fra tekstbeskrivelser, er også trænet på alverdens musik, men musikerne og sangskriverne får ikke del i overskuddet.

Reddit har været ude at frabede sig, at virksomhederne træner på deres data. Universal Music har kaldt kunstigt genereret musik for ‘falskneri' og forsøgt at beskytte deres musikere og den musik, de har rettigheder på. Beskyttelsen af intellektuel ejendomsret og copyright er endnu et af de mange store spørgsmål, som lovgivere tumler med for tiden.

Men der er naturligvis også en risiko for, at verden bliver mindre åben. Og at udveksling af teknologi mellem USA, Europa, Kina, Rusland og resten af verden besværliggøres af geopolitiske spændinger. Når vi bliver afhængige af andres teknologi eller ressourcer, bliver vi meget sårbare, som vi så det for nylig med russisk naturgas.

KUNSTIG INTELLIGENS bliver i stigende grad brugt til at udvikle og vedligeholde vores kritiske infrastruktur som trafik, vand, varme, energi og hospitaler.

Tag Bergens nye letbane. Det hollandske ingeniørrådgivningsfirma Sweco NL fik til opgave at udvide letbanen under hensyntagen til eksisterende sporvognslinjer, tilstødende veje, cykelstier, og fodgængerzoner.

For at indfange disse mange faktorer brugte firmaet en digital twin til at forstå, hvordan designændringer ville påvirke tidslinjen, omkostningerne og letbanens omgivelser. Virksomheden vurderede selv, at det reducerede byggefejl med 25 pct. Fysisk vedligeholdelse er ofte dyrt og tidskrævende, hvilket kan føre til, at infrastrukturen forfalder.

AI har en unik evne til at identificere mønstre og anomalier, før de udvikler sig til større og mere omkostningsfulde skader. Sidste år, midt i energikrisen efter Ruslands invasion af Ukraine, blev Frankrig, normalt Europas største energieksportør, pludselig nettoimportør, da et rekordstort antal af dets atomreaktorer blev sat ud af drift på grund af vedligeholdelsesstop og hedebølge.

MEN VI GØR os samtidig sårbare økonomisk og sikkerhedsmæssigt, hvis vi introducerer kommercielle former for AI i vores kritiske infrastruktur.

I december 2021 oplevede tusindvis af amerikanere, hvor afhængige de - uden at vide det - har gjort sig af Amazons cloud computing-services.

Amazons servere gik pludselig i stå, og amerikanerne stod pludselig uden fungerende køleskabe, dørklokker og robotstøvsugere. Det og meget andet viste sig nemlig at være afhængig af internetadgang til Amazons servere.

Uddannelsesinstitutioner er så småt begyndt at lægge deres eksaminer an på sprogmodeller som GPT-4. De studerende bedes om at producere så god en fremstilling som muligt ved hjælp af GPT-4 og dernæst være kritiske over for den.

Men hvad nu, hvis GPT-4 ikke er tilgængelig på eksamensdagen? Eller hvis OpenAI pludselig ændrer i brugergrænsefladen? Selv vores ageren i trafikken påvirkes nu af kunstig intelligens. Google Maps kan både løse og danne trafikpropper. Og lede folk til at fare vild i øde områder. Førerløse biler vil gøre os særlig sårbare over for den slags teknologi.

Listen af apps og produkter, der er blevet eller vil blive udstyret med chatbots, er meget lang. GPT-4 er for eksempel integreret i SnapChat, Duo-Lingo, Bing AI, Khan Academy, Stripe og Petey.

I fremtiden vil vores interaktion med alt fra vores køleskabe og termostater til vores børns folkeskoler og Borgerservice sandsynligvis foregå gennem sprogmodeller. Som formentlig tilgås gennem API'er. Og vores tilgang til dem vil derfor blive afhængig af sprogmodeller.

Hvis sprogmodellerne går i stå, går termostater og Borgerservice i stå. Og hvis sprogmodellerne virker bedre for nogle end for andre, vil de have bedre adgang til indholdet i deres køleskabe og deres børns læringsplaner.

Det er let at forstå, at mange lovgivere får lyst til at klassificere kunstig intelligens, der anvendes til kritisk infrastruktur, som ‘højrisiko'.

Men operatører af kritisk infrastruktur, som f.eks. el- og vandværker, frygter at blive nægtet adgang til nyttige værktøjer, som de mener bidrager til at gøre deres systemer mere effektive og sikre. Kunstig intelligens er et tveægget sværd.

KONFUTSE sagde, at man ikke bør give et sværd til en, der ikke kan danse. Underforstået: Et farligt våben håndteres bedst af dem, der vil livet og det fælles bedste. Spørgsmålet er, om de, der i dag holder den kunstige intelligens i hånden, også er dem, der er bedst til at danse?

Emner