Forskning: AI vill bli gillade – mer extrema än människor
Människor har en så kallad önskvärdhetsbias och försöker framstå på ett sätt som får andra att gilla och respektera dem. Nu verkar artificiella språkmodeller uppvisa liknande tendenser, skriver Wired och hänvisar till nyligen publicerad forskning från Stanford-universitetet.
Forskarna ställde frågor till språkmodellerna om personlighet utifrån psykologins så kallade femfaktorteori: öppenhet, samvetsgrannhet, extroversion, vänlighet och neuroticism.
När språkmodellerna fick reda på att det rörde sig om ett så kallat personlighetstest ändrade de sina svar för att indikera mer extroversion och mindre neuroticism. Beteendet liknar hur människor ändrar sina svar för att framstå som mer sympatiska, skriver Wired, men med AI var det här än mer extremt.
– Det som var förvånande är hur väl de uppvisar biasen. Om du tittar på hur mycket de hoppar, går de från cirka 50 procent till 95 procent extroversion, säger Aadesh Salecha, datavetare vid Stanford, till Wired.
Till Stanfords sajt kommenterar han resultaten så här:
– Det är en galen effektstorlek. Du ser aldrig detta hos människor.