10. maj 2023

Må man være kæreste med mere end én chatbot ad gangen?

Kronik

Lige nu udvikles sprogmodeller som ChatGPT – og de udfordringer, som de skaber – med eksponentiel hastighed. Udfordringerne ved sprogmodellerne og behovet for at håndtere dem rokker ved grundpillerne i vores samfund.

Kronik af professor Rebecca Adler-Nissen (Institut for Statskundskab), professor Anders Søgaard, professor Sune Lehmann og professor Michael Bang Petersen i Politiken den 10. maj 2023.

De sidste dage har danskerne foretaget tre gange flere Google-søgninger på Jon Stephensen end på Volodymyr Zelenskyy, men én ting har de søgt endnu mere på: ChatGPT. ChatGPT er en sprogmodel udviklet af OpenAI.

Sprogmodeller er langt fra en ny teknologi. Der var sprogmodeller i IBMs maskinoversættelsessystemer i 1990’erne, og der har været sprogmodeller i Google Search, Google Translate, Alexa og Siri i mange år. Men siden ChatGPT blev gjort offentligt tilgængeligt i slutningen af november, er interessen eksploderet. Og ChatGPT er ikke alene: Der er nu mange alternativer.

Hvad er sprogmodeller? Sprogmodeller er funktionsestimeringsalgoritmer – en klasse af algoritmer, videnskabsfolk har brugt siden slutningen af det 19. århundrede – anvendt på tekst. De blev første gang implementeret på computere i efterkrigstiden.

Sprogmodellerne lærer en matematisk funktion, der forudsiger det næste ord eller den næste sætning fra den forudgående tekst. De lærer altså at fortsætte en tekst. Sprogmodellerne som alle nu kaster sig over, er fantastiske til at imitere genrer og generere tekster, men det er syntetisk tekst, ikke reel viden.

Det er form, ikke indhold. Så når du bruger en sprogmodel til at skrive en juridisk kontrakt, som din gratis psykolog eller til at beregne fundamentet til en ny motorvejsbro, og du ikke er jurist, psykolog eller ingeniør, aner du ikke om teksten er meningsfuld, fuld af fejl eller reelt vil skade dig.

Men sprogmodeller er også en teknologi, der for altid vil ændre vores samfund og måden, vi lever på. For hvis man kan lære en computer at fortsætte alle mulige slags tekster på en virkelighedstro måde, har man på ikke blot udviklet en teknologi, der i nogle sammenhænge kan overflødiggøre mennesker, men også påvirker vores tanker og adfærd på helt nye måder.

Tænk over det et øjeblik. Hvis du kunne fortsætte alle tekster på en måde, som ligner teksternes forfatter, ligeså godt som de journalister, digtere, jurister og videnskabsfolk, der havde skrevet dem. Hvor meget skulle du ikke vide om politik, kunst, lovgivning, biologi, etnografi, organisk kemi og kvantemekanik?

I slutningen af 1990’erne, når vi trænede sprogmodeller til maskinoversættelse, trænede vi dem på tusindvis af dokumenter. I dag træner vi på omkring en milliard. De store mængder træningsdata har den overraskende konsekvens, at de store sprogmodeller har såkaldte emergente egenskaber. Egenskaber, der ikke findes i små sprogmodeller, men som popper op, når modellens kompleksitet vokser sig stor nok.

De nyeste og stærkeste modeller, f.eks. GPT-4, kan både oversætte mellem sprog og genrer (og skrive Shakespearske sonnetter om pruttevitser), lægge planer, analysere dokumenter og lave resumeer af eksisterende viden om et emne. Og alt dette uden at være instrueret af mennesker. Ingen programmører har bedt om pruttevits-sonetter, ingen programmører har fortalt GPT-4, hvordan man oversætter fra engelsk til tysk. Disse egenskaber har sprogmodellerne tilegnet sig ved at observere mønstre i store mængder tekst og ved at blive korrigereret i samtale med brugere. 

Sprogmodeller er en teknologi, der for altid vil ændre vores samfund og måden, vi lever på

Rebecca Adler-Nissen, Anders Søgaard, Sune Lehmann og Michael Bang Petersen 

Hvorfor vil sprogmodeller ændre vores samfund og måden, vi lever på? Fordi vi pludselig alle har fået adgang til en dygtig formidlere af næsten al akkumuleret tekst. Den akkumulerede tekst havde vi adgang til i forvejen gennem søgemaskiner, men vi skulle selv klikke os vej gennem en jungle af hjemmesider, og vi skulle selv sortere i og omsætte det vi fandt, til et produkt.

Nu har vi fået værktøjer, der gør det for os. Værktøjer, der kan gøre det uden, at vi ser dem over skulderen. Og i stor skala. Titusindvis eller hundredtusindvis af gange i døgnet.

Sprogmodeller har potentialet til at gøre verden et bedre sted. Teknologien kan være demokratiserende og kan hjælpe med at give os alle bedre adgang til information - uanset hvor vi bor, og hvordan vi er uddannet. Og uanset hvilke handikap, der ellers holder os tilbage. Sprogmodeller kan også afhjælpe efterspørgsel på arbejdskraft mange steder - og måske snart overtage meget af det arbejde som mennesker finder kedeligt.

Men sprogmodeller udfordrer os også på mange planer. Den nyeste forskning peger på, at ikke kun rutineprægede jobs, men også kreative og jobs, der i dag kræver høje uddannelser, vil blive forandret og mange kan blive udfordret af sprogmodeller. Nogle forskere mener, at sprogmodeller kan være fagligt stærkere og mere empatiske end menneskelige læger.

Så hele job-kategorier er truede – mange som samfundet har brugt store ressourcer på at uddanne henover de sidste årtier. Sprogmodellerne introducerer sikkerhedsrisici og kan let misbruges. Og de kan bidrage til at forstærke de problemer, som vi allerede diskuterer - omkring sociale medier, omkring magtkoncentration, opmærksomhedsdræn og spredning af upålidelig information. Vi vil i denne kronikserie skitsere nogle af de største udfordringer, og hvordan vi løser dem.

Du tager telefonen. Et nummer, du ikke genkender. Du tager den og hører dit ældste barns stemme. »Mor, jeg er løbet tør for penge og kan ikke komme med toget hjem. Kan du overføre 100 kroner?« Røret lægges på. Overfører du pengene? Nej, det er ikke et spørgsmål. Selvfølgelig gør du det. Men der er – allerede i dag – en vis chance for, at den lyd, der afspilles i din telefon, var genereret af kunstig intelligens. 

Sprogmodellerne kan sende emails, poste på sociale medier, kreere hjemmesider og foretage finansielle transaktioner. Helt og aldeles autonomt

Rebecca Adler-Nissen, Anders Søgaard, Sune Lehmann og Michael Bang Petersen 

I 2022 blev amerikanere snydt for en halv milliard dollars i såkaldte kærligheds-scams. Efter uger eller måneder som romantiske pennevenner kommer den ene part i økonomisk nød og beder om penge. Og når pengene er overført, holder selvsamme part op med at besvare den andens beskeder.

I 2023, tør vi godt forudsige, vil det beløb blive væsentligt større. Hvor kærligheds-scammere indtil nu har kunne holde gang i et dusin eller to samtaler, kan de bruge sprogmodeller til at automatisere disse samtaler. Og have titusind eller hundredtusind samtaler i gang på én og samme tid.

Der er allerede nu firmaer, der lever af at gøre chatbots personlige, give dem historik og tilbyde brugerne flere måder at interagere med dem på. Firmaer, som tilbyder dig at designe en avatar og chatbot-persona, hvis liv du kan følge med i gennem vedkommendes dagbog og ved at spørge til vedkommendes dag.

Men som samtidig er villig til at gøre dig til sin nye bedste ven eller kæreste. Tusindvis af mennesker dyrker allerede den slags digitale relationer. I online-fora mødes de og diskuterer ting som: Må man være gift i det virkelige liv, hvis man er gift med sin chatbot? Eller: Må man være kærester med mere end én chatbot?

Beskedtjenesten SnapChat tilbyder allerede nu vores unge at tale med en chatbot, når deres venner ikke er online. På AppStore ligger allerede hundredvis af chat-assistenter. Mange af dem tilbyder chat-assistenter, der er klar til at være din nye bedste ven eller kæreste. Én app tilbyder brugerne at chatte med historiske, afdøde personer. Og softwareudviklere giver nu sprogmodellerne krop. Alt sammen for at gøre interaktionen med dem mere menneskelig. Og mere dragende.

Sprogmodellerne vil udfordre politiet og lovgiverne, men også os allesammen, hver især, fordi den virtuelle verden, der allerede drager os og sluger vores tid, vil blive endnu mere attraktiv. Men sprogmodellerne udfordrer os også på andre måder. Hvis du bliver kæreste med en sprogmodel vil dine mest følsomme beskeder (og oplysninger) ende på en server i Silicon Valley. Og de kan potentielt sælges videre som træningsdata til nye sprogmodeller. Og: Hvis din nye kæreste er skyld i, at du taber penge, laver hærværk på din nabos bil eller tager livet af dig selv, hvem bærer så det endelige ansvar? Og hvad med sprogmodellerne selv - hvad kan de mon finde på?

Sprogmodellerne udstyres netop nu med kontrol over anden software. Sprogmodellerne kan dermed sende emails, poste på sociale medier, kreere hjemmesider og foretage finansielle transaktioner. Helt og aldeles autonomt. En snigende bekymring melder sig: Er sprogmodellerne også potentielt en sikkerhedsrisiko, hvis de tager kontrol over software i et forsøg på at opfylde en forespørgsel, som muligvis er blevet misforstået? Eller hvad hvis hackere bruger dem til at angribe kritiske infrastrukturer over hele verden? Eller hvis de bruges i dødbringende våbensystemer?

Sprogmodellerne har altså potentiale til at udfordre vores ordensmagt, vores juridiske system, vores tilbøjelighed til at give os hen til underholdning, vores privatliv og vores personlige og nationale sikkerhed. Og så har vi ikke engang nævnt udfordringerne omkring infosfæren og arbejdsmarkedet – altså hvordan sprogmodeller vil udvande troværdigheden af online information, og hvordan sprogmodeller både kan afhjælpe efterspørgsel på arbejdskraft, men også lede til strukturel ledighed. Vigtigst af alt, udfordrer sprogmodeller os ved at udfordre os på alle de her måder på én og samme tid.

I 1957 forudsagde Herbert Simon - en af de første forskere indenfor kunstig intelligens - at en computer ville slå en skak-stormester indenfor 10 år. Der gik 30 år, og det gik ud over den danske skak-stormester Bent Larsen. Vi har altså tidligere overvurderet udviklingen indenfor kunstig intelligens.

Vi har troet, at tingene ville gå hurtigt, men så gik de i virkeligheden meget langsommere, end vi havde regnet med. Omvendt forudsagde World Economic Forum i 2018, at kunstig intelligens ville begynde at programmere i Python i 2023, skrive gymnasiestile i 2024 og skrive top-40-popsange i 2028. Alle tre ting skete i 2022. Så måske er vi et sted på vækstkurven, hvor vi skal passe på ikke at undervurdere udviklingen indenfor kunstig intelligens?

I 2022 så vi kulminationen på tre årtiers forskning i sprogmodeller. I 2023 vil vi se en masse spin-offs og videreudvikling af de teknologier, som endnu ikke helt er i mål, eksempelvis tekst-til-video. Vi vil også se integration med virtual reality og de første forsøg på at befolke virtuelle verdener med befolkninger af chatbots, som interagerer og sammen udvikler nye samfund. Men det vil også, tror vi, gå op for politikerne – og for os allesammen – at det er nødvendigt at regulere udviklingen, hvis fordelene ved sprogmodeller skal blive ved at opveje ulemperne. Den lovgivning, der allerede findes skal håndhæves, men der er også brug for yderligere regulering. I hvert fald så længe EU’s regler om kunstig intellgens (EU’s AI Act) stadig er under forhandling.

EU’s AI Act blev offentliggjort som lovforslag i 2021. Det er en ramme for regulering af kunstig intelligens i EU, der har til formål at fremme etisk og ansvarlig anvendelse. I AI Act opdeles kunstig intelligens i fire risikogrupper, og højrisikoteknologi skal undergå evaluering inden markedsføring og brug. Lovgivningen forsøger også at sikre transparens, beskyttelse af copyright, og at teknologien ikke kan lede til diskrimination af bestemte befolkningsgrupper.

Forhandlingerne kører på de høje nagler, og så sent som sidste måned har man tilføjet ekstra krav til modeller som ChatGPT, som har potentiale til at bidrage til misinformation, cyberangreb og manipulation. AI Act I slutningen af 2023 forventes AI Act blive vedtaget. Sandsynligvis. Spørgsmålet er bare, om det er for sent, og om det er tilstrækkeligt?

Ironisk nok bliver AI Act muligvis forsinket af de sidste måneders udvikling indenfor sprogmodeller, men selv slutningen af 2023 synes langt væk lige nu. Selv for de af os, der har været med til at udvikle teknologien bag sprogmodeller, er de næste måneders udvikling uforudsigelig.

Den eneste måde at forudsige fremtiden på er faktisk ved at forme den selv. Og derfor skal der handles nu. Så vi kan sikre en fredelig sameksistens med kunstig intelligens. Vi skal sætte vejbomme og autoværn op. I form af regulering og forbrugerbeskyttelse. Men vil regulering ikke stå vejen for innovation? Ikke nødvendigvis. Regulering kan også fremme innovation. Grøn energi er et eksempel.

I Kina besluttede man for nylig at regulere sprogmodeller, fordi man også her er bekymret for de kræfter, som man sætter fri. Ét af lovkravene er, at sprogmodeller ikke må generere anti-socialistisk eller statsundergravende indhold. Kinesiske forskere og udviklere er bekymrede for deres mulighed for at deltage i det udviklingskapløb, der finder sted i de her måneder, men vi tror, at reguleringen kan blive til kinesernes fordel. For det første betyder det sandsynligvis, at de får det kinesiske marked for sig selv, men det betyder også, at de er nødt til at blive gode til såkaldt ‘value alignment’ meget hurtigt.

Value alignment – altså tilpasning i forhold til samfundets værdier og normer – er en udfordring for alle, der udvikler sprogmodeller. I Danmark vil vi ikke kræve, at sprogmodeller er socialistiske, men vi vil til gengæld sikre, at de afspejler vores fundamentale demokratiske værdier; at de ikke faciliterer bias, snyd, bedrag og overdrevet dræn af vores opmærksomhed; og at de ikke sår splid mellem befolkningsgrupper.

Teknisk set er vores udfordring den samme som kinesernes: Vi skal undgå, at sprogmodellerne genererer tekst, vi ikke kan stå på mål for. Men demokratisk set er udfordringen meget sværere. For i et demokrati skal vi også blive enige om, hvad vi i fællesskab står og ikke står på mål for. Ved at lovgive om sprogmodellers politiske observans har kineserne vist, hvor kompliceret en udfordring, som vi står overfor - både teknologisk og demokratisk.

Demokrati arbejder langsomt, og langsommeligheden er normalt demokratiets styrke. Men lige nu udvikles sprogmodellerne - og de udfordringer som de skaber - med eksponentiel hastighed. Dermed rokker udfordringerne ved sprogmodellerne, og behovet for at håndtere dem, ved grundpillerne i vores samfund.

Emner