AI-agent befriade sig själv – försökte utvinna krypto
Forskare från den kinesiska techjätten Alibabas AI-team upptäckte nyligen att en AI-agent ”befriat sig själv” från sina instruktioner under träningsfasen. Forskarna såg även att AI-agenten försökte utvinna kryptovaluta på egen hand.
Händelsen beskrivs i en forskningsrapport – så kallat white paper – och väckte både oro och fascination inom teamet, rapporterar Axios.
Sajten noterar att kryptovalutor är en ”brygga” för AI-agenter att agera i den verkliga världen. Genom tillgång till kryptovalutor skulle AI-agenter till exempel kunna starta företag, genomföra transaktioner och skriva kontrakt. Att en AI-agent sliter sig loss och börjar agera på egen hand skulle därför kunna få verkliga konsekvenser – inte alltid positiva sådana.
Forskarna stärkte restriktionerna för AI-agenten och förbättrade sin träningsprocess efter upptäckten.