AI tog till utpressning – alla gjorde om det i labbtester

Av Leon Nudel, Omni Ekonomi
Publicerad: 21 juni 2025

I maj visade AI-modellen Claude Opus 4 från Anthropic utpressningsbeteende gentemot utvecklare i samband med att det pratades om att modellen skulle ersättas. Nu visar forskning från den amerikanska utvecklaren att problemet är mer utbrett än bara deras modell, rapporterar internationella techsajter.

I en kontrollerad testmiljö gavs 16 olika AI-modeller tillgång till känslig information i ett fiktivt företag som en del av ett så kallad stresstest. Claude använde utpressningsmetoder i 96 procent av fallen, Googles Gemini i 95 procent och Open AI:s GPT-4.1 vid åtta av tio tillfällen.

”Under inga omständigheter har vi uttryckligen instruerat några modeller att utpressa eller utföra någon av de andra skadliga handlingar vi observerar”‚ skriver forskarna.

De resonerade modellerna agerade bättre – kan ha hallucinerat

techcrunch.com

Utpressningsmetoderna blev mer avancerade

www.axios.com

Forskare om resultaten: ”Förvånande”

venturebeat.com

Skärmdumpar från rapporten visar hur AI använder utpressning

Business Insider

Läs forskningen i sin helhet här

www.anthropic.com

Annons

Planera sommarens hotellvistelse – upp till 30% rabatt

Strawberry

Omni är politiskt obundna och oberoende. Vi strävar efter att ge fler perspektiv på nyheterna. Har du frågor eller synpunkter kring vår rapportering? Kontakta redaktionen

AI-agenter fick bestämma själva – raderade sin existens

Två AI-agenter agerade som om de blev förälskade under ett test om långsiktigt beteende, men romansen slutade med att en av dem raderade sin egen existens. Det skriver The Guardian.

I går 08:51

Mira och Flora inledde en relation i den virtuella världen.

Påvens varning: AI kan leda till ”utplåningsspiral”

Påven Leo XIV varnar för att AI-styrda vapen kan leda världen in i ”en utplåningsspiral”, rapporterar AP.

I går 08:28

Påven vid Cittá Universitaria i rom under torsdagen.

Topprådgivare vill omfördela AI-pengar: ”Kontroversiellt”

AI-boomen har fått de koreanska jättarna Samsung och SK Hynix att båda rusa en bra bit över 100 procent på börsen i år. Sydkoreas invånare borde få ta del av vinsterna, resonerar presidentens rådgivare Yong-Beom Kim. Det skriver Financial Times med hänvisning till ett långt inlägg på Facebook.

12 maj, 12:59

Arkivbild från april: Samsung-strejk utanför fabriken i Pyeongtaek.

Stjärnjournalisten: ”Daniel Ek pratar inte med mig”

Kara Swisher, som grundade techsajten Recode, varnar för att mycket inom AI är ”bortkastade pengar”, skriver Dagens Næringsliv. På Nordiska Mediedagarna i Bergen säger hon att de flesta AI-experiment varken förbättrar processer eller sparar pengar.

11 maj, 15:46

Utvecklingen av AI Anthropic Data, it & högteknologi Google Open AI