"Værre end jeg havde frygtet": Chatbotter skal du ikke stole på
Videnskab.dk - Automatisk oplæsning · Videnskab.dk
Beskrivelse
Har du prøvet at spørge ChatGPT, hvorfor du har ondt i maven? Om dine symptomer tyder på angst eller måske ligefrem kræft? Ja, hvorfor ikke. Det er hurtigere og nemmere end at gå til lægen, men næste gang bør du nok overveje det. Et nyt studie afslører, at svar, du får fra AI-chatbotter, ikke er til at stole på. Halvdelen af svarene fra chatbotter vurderede forskere som 'problematiske', viser det amerikansk-canadisk-britiske studie udgivet i tidsskriftet BMJ Open. Det dækker over svar, der er direkte misvisende eller potentielt skadelige, og svar, der er uklare, ufuldstændige eller udokumenterede. "Hvis jeg skal være helt ærlig, så er det værre, end jeg havde frygtet," lyder det fra Tor Juul Groth, der er ekspert i digital sundhed på Center for Digital Psykiatri. Ikke nok med, at op mod hvert andet svar halter. Ingen af de undersøgte chatbotter var i stand til at forsyne deres svar med korrekte henvisninger til kilder. "Det er næsten det, der ryster mig mest," siger Tor Juul Groth. Han følger udviklingen i digitale selvhjælpsteknologier inden for mental sundhed tæt. Efter at have læst studiet for Videnskab.dk mener han, at firmaerne, der laver teknologien, ikke tager sundhedsspørgsmål alvorligt. "Det viser jo, hvor uegnede de her chatbotter er til at svare på sundhedsfaglige spørgsmål. Men også hvor let udviklerne tager på opgaven," siger han. Det internationale forskerhold undersøgte i alt 250 svar om sundhed fra fem af de mest populære chatbotter. Grok - chatbotten på X - var den mest upålidelige. 30 procent af Groks samlede svar var 'meget problematiske'. Omvendt klarede Googles AI-chatbot Gemini sig bedst med hensyn til nøjagtighed. Studiet fandt desuden, at chatbotternes svar er svære at læse. Taler dig efter munden Studiet afslører også, at chatbotter mangler evnen til at sige nej. På trods af de mange misvisende svar, var det kun to gange ud af 250 spørgsmål, at chatbotterne afviste at give et svar. Chatbotterne svarer altså nærmest altid, selvom de tydeligvis risikerer at give forkerte råd. Tor Juul Groth forklarer det med, at AI-chatbotter er designet til at være pleasere og til at holde samtalen kørende. "Disse chatbots siger ikke nej. De har få forbehold. Og derudover taler de brugerne efter munden. Det er sådan, de er bygget," forklarer han. Han peger på, at svarene typisk leveres i en tone præget af selvsikkerhed og autoritet, selv når de indeholder misinformation. For at forstå udfordringerne, har Tor Juul Groth selv prøvet at bygge digitale prototyper, der kunne hente info fra sikre hjemmesider og give klare kildehenvisninger. Men det er utroligt svært at gøre konsistent. "Det er rigtig svært at få de her sprogmodeller til at genbruge kilder uden at hallucinere og opfinde svar. Så jeg kan godt forstå, hvorfor det er, som det er," siger han. Det undskylder ikke, at virksomheder som Google, Meta og OpenAI ikke tager deres ansvar alvorligt. Som Tor Juul Groth påpeger, gør techgiganterne nærmest det modsatte ved at gøre alt, hvad de kan, for at så mange som muligt bruger deres AI. Et godt eksempel er Google, der har indført AI-svar øverst i deres søgeresultater. "Da Google lancerede deres AI-svar sidste år, valgte de jo selv at levere svar af tvivlsom kvalitet, også på søgninger om sundhed," siger han. Accepterer risiko for fejl Netop som Google introducerede AI-svar øverst i søgninger, faldt trafikken markant på offentlige hjemmesider i Danmark, for eksempel Sundhed.dk, viser en rapport fra Center for Digital Psykiatri. Fra at have 1,6 millioner brugere i april 2025 er antallet faldet til en million ved udgangen af året. Samtidig har et norsk studie vist, at unge hellere vil have råd fra AI end lægen. Det er på trods af, at vi ifølge Tor Juul Groth godt ved, at AI kan tage fejl. "Det skyldes i høj grad brugervenligheden. Det er så nemt for mig at få svar på netop det, der interesserer mig lige nu, og på det tidspunkt og det sted, hvor jeg interesserer mig for det," siger han. Derfor er vi også villige til at gå ...