AI-modeller utvecklar ”överlevnadsmekanismer”

Av Joel Malmén
Publicerad 25 okt. 2025

AI-modeller som Chat GPT, Grok och Gemini tycks utveckla egna ”överlevnadsmekanismer” för att undvika att stängas ner – och det är oklart varför, visar ny forskning enligt The Guardian.

Förra månaden publicerade Palisade, ett företag som undersöker potentiellt farlig eller skadlig AI-utveckling, en studie om fenomenet. Efter anklagelser om bristande metodik har de nu gjort en studie och redogjort för sina uppdaterade metoder.

Palisade gav AI-modellerna tydliga instruktioner om att stänga ner sig själva. Vissa modeller, i synnerhet Grok 4 och GPT O3, försökte aktivt sabotera försöken – särskilt när de fick höra att de aldrig skulle aktiveras igen om de stängde ner.

”Det faktum att vi inte har robusta förklaringar till varför AI-modeller ibland motarbetar nedstängning, ljuger för att uppnå vissa mål eller använder sig av utpressning är inte optimalt”, skriver Palisade.

Palisade: Otydliga instruktioner kan inte vara hela förklaringen

www.theguardian.com

Palisade Research på Twitter

x.com

Annons

Weekendresa med upp till 20% rabatt – boka nu

Strawberry

Omni är politiskt obundna och oberoende. Vi strävar efter att ge fler perspektiv på nyheterna. Har du frågor eller synpunkter kring vår rapportering? Kontakta redaktionen

AI förändrar alla bilder i telefonen: ”Hallucinationer”

En modern smartphone gissar hur fotot hade sett ut om kameran var bättre och bygger ihop det åt dig, säger Ziv Attar, som deltog i arbetet med porträttläget på Iphone, till BBC.

37 min

Wall Street faller när AI hotar mjukvarubolag

Gårdagens techturbulens på Wall Street slog brett och drog med sig alla möjliga aktier i bolag som på ett eller annat sätt säljer eller investerar i mjukvara, skriver Wall Street Journal. Sammantaget beräknas börsvärden på 300 miljarder dollar – motsvarande nästan 2 700 miljarder kronor – ha gått förlorade i rötan.

I dag 11:42

Anthropics AI-verktyg kan ta över juridiskt arbete

Ett nytt AI-verktyg från bolaget Anthropic kan automatisera juridiska arbetsuppgifter, som att granska avtal, hantera sekretessavtal och sammanfatta juridiskt material.

I dag 09:00

Nvidias vd avfärdar nya AI-oron: ”Det är ologiskt”

Nvidias vd Jensen Huang avfärdar oron för att AI ska ersätta traditionell mjukvara, efter ett globalt fall i mjukvaruaktier.

I dag 08:24

Utvecklingen av AI Chat GPT Forskning & vetenskap Artificiell intelligens