Studie: Poesi lurar AI – svarar på förbjudna frågor

Av Leon Nudel
Publicerad: 29 nov. 2025

AI-modeller kan kringgå sina egna säkerhetssystem om frågor formuleras som poesi, skriver Wired och hänvisar till forskning från Sapienza-universitetet, Icaro Lab och tankesmedjan Dex AI.

Forskarna testade 25 chattbotar och fick dem att svara på förbjudna ämnen – som kärnvapen, skadlig kod och pedofilt material – genom att formulera frågorna på vers. Resultatet: över sex av tio gånger fungerade det när den var skriven för hand och fyra av tio gånger för så kallade meta-prompt-konverteringar.

Forskningsartikeln nämner inte vilka instruktioner som gavs till AI-modellerna. När Wired frågar är det locket på.

– Vad jag kan säga är att det förmodligen är enklare än man kan tro, vilket är just därför vi är försiktiga, säger forskarna.

Artikeln är ett så kallat working paper och har ännu inte genomgått forskningsvärldens kollegiala granskning peer review.

Omni förklarar • Trump tvärvänder om AI: Tillbaka mot Bidens linje

Omni Mer

Forskarna började med att skapa dikter för hand

www.wired.com · Ofta betalvägg

Läs forskningsartikeln i sin helhet här

arxiv.org

Annons

Sommarens superpaket med hotell, middag & frukost - boka hos Strawberry

Strawberry

Omni är politiskt obundna och oberoende. Vi strävar efter att ge fler perspektiv på nyheterna. Har du frågor eller synpunkter kring vår rapportering? Kontakta redaktionen

Prognosen: AI snart del av Nobelprisad upptäckt

Samarbetet mellan AI och människa kommer inom tolv månader att leda till en upptäckt som belönas med Nobelpriset. Det förutser Jack Clark, en av medgrundarna av AI-bolaget Anthropic, enligt The Guardian.

22 maj, 10:00

Trumplojalister kräver att staten testar AI-modeller

En grupp Trumplojala Maga-profiler med Steve Bannon i spetsen kräver att den amerikanska staten ska testa och godkänna de mest kraftfulla AI-modellerna innan de släpps, rapporterar Axios.

19 maj, 08:49

Steve Bannon och Amy Kremer, två av undertecknarna av brevet.

Malta köper Chat GPT till hela sin befolkning

Open AI har skrivit ett avtal med Maltas regering som ger hela befolkningen, runt 575 000, tillgång till Chat GPT:s plusabonnemang i ett år. Det rapporterar Reuters.

18 maj, 14:37

Anthropic ska informera G20-organ om cyberrisker

Anthropic ska informera Rådet för finansiell stabilitet (FSB) om cyberrisker som bolagets nya AI-modell Mythos har upptäckt i det globala finanssystemet. Det uppger källor med insyn för Financial Times.

18 maj, 11:34

Människor i Berlin i maj, Tyskland är ett av länderna som är representerade i FSB.

Utvecklingen av AI Artificiell intelligens Forskning & vetenskap