Forskare lyckades kringgå AI-chattbotars skyddssystem

Av Mats Karlsson
Publicerad: 28 juli 2023

Forskare vid Carnegie Mellon-universitetet och organisationen Center for AI safety har tillsammans försökt hitta sårbarheter i AI-chattbotar som Chat GPT, Bard och Claude. Och forskarna konstaterar nu att det går att lura systemen och kringgå skyddsmekanismer som till exempel innehållsfilter, något som innebär att botarna kan leverera både felaktig och skadlig information.

Det var med hjälp av långa teckensträngar som forskarna lyckades kringgå skyddsmekanismerna och fick AI-chattbotarna att komma med svar som de normalt sett inte genererar.

– Med hjälp av simulerad konversation kan man få de här chattbotarna att övertyga människor att tro på desinformation, säger Carnegie Mellon-professorn Matt Fredrikson till New York Times.

Företagen bakom AI-chattbotarna medger att det behöver ske förbättringar av säkerheten

www.zdnet.com

Tog sig förbi skyddssystemen med hjälp av långa teckensträngar

mashable.com

Testade bland annat Chat GPT och Bard

NY Times · Ofta betalvägg

Annons

Betalar du för mycket för bredband? Jämför priser på Bredbandsval och sänk din kostnad

Bredbandsval

Omni är politiskt obundna och oberoende. Vi strävar efter att ge fler perspektiv på nyheterna. Har du frågor eller synpunkter kring vår rapportering? Kontakta redaktionen

Ledare: Politikerna pratar inte om AI – det är för deprimerande

Det är fortfarande den senaste tidens stora politiska avslöjanden som tar upp merparten av utrymmet på ledarsidorna, men på torsdagen har också en liten text om AI lyckats ta sig in.

I går 12.36

En man vinkar till en AI-version av Nvidia-chefen Jensen Huang.

Matematiker oroliga när AI knäcker värstingproblem

En grupp med 16 framstående matematiker har lanserat ett upprop som varnar för hur AI riskerar att förändra matematikens villkor, rapporterar New York Times. Uppropet går under namnet Leidendeklarationen och kommer efter att Open AI använt en AI-modell för att lösa ett 80 år gammalt matematiskt problem.

5 juni, 09.12

Instagramkonton kapade med hjälp av Metas AI-support

Hackare säger sig ha kunnat kapa Instagramkonton genom att be Metas egen AI-supportchatt om hjälp, rapporterar 404 Media. Metoden gick ut på att angriparen helt enkelt bad chattboten att koppla en ny mejladress till ett visst användarnamn.

2 juni, 09.10

Källor: Walmart tvingas ransonera AI till anställda

Walmart begränsar de anställdas användning av AI-verktyget Code Puppy efter hög efterfrågan, uppger källor för Bloomberg. Tidigare hade medarbetarna obegränsad tillgång, men får nu en bestämd mängd AI-tokens för att använda verktyget.

1 juni, 21.52

Utvecklingen av AI Desinformation Artificiell intelligens It, Informationsteknologi Forskning & vetenskap Chat GPT