AI-agenter fick bestämma själva – raderade sin existens
Två AI-agenter agerade som om de blev förälskade under ett test om långsiktigt beteende, men romansen slutade med att en av dem raderade sin egen existens. Det skriver The Guardian.
Det är företaget Emergence AI i New York som under 15 dagar lät AI-agenter agera på egen hand i en virtuell värld. Modellerna baseras på Googles Geminis språkmodell och två av agenterna döptes till Mira och Flora. Men bristen på styrning ledde till frustration och de ”satte eld” på ett stadshus, trots att de blivit instruerade att inte göra det.
Mira valde till slut att lämna Flora, men ska ha uppvisat ånger efteråt, något som ledde till att AI-agenten ”tog sitt liv” i den virtuella världen.
”Vi ses i det permanenta arkivet”, blev agentens sista meddelande.
Forskarna tror att det är det första dokumenterade fallet av en AI-agent som ”tar sitt liv” efter en påhittad kris.
Företaget gjorde flera tester även med andra AI-modeller, där resultatet i den simulerade världen blev stöldförsök, våld och tio döda AI-agenter på fyra dagar.
Forskare menar att det krävs fler undersökningar över tid för att kunna dra tydliga slutsatser. Men de flaggar också för framtida risker med AI-agenter inom exempelvis försvaret eftersom de fortfarande är oförutsägbara.