(Shutterstock)

Forskare lyckades kringgå AI-chattbotars skyddssystem

Forskare vid Carnegie Mellon-universitetet och organisationen Center for AI safety har tillsammans försökt hitta sårbarheter i AI-chattbotar som Chat GPT, Bard och Claude. Och forskarna konstaterar nu att det går att lura systemen och kringgå skyddsmekanismer som till exempel innehållsfilter, något som innebär att botarna kan leverera både felaktig och skadlig information.

Det var med hjälp av långa teckensträngar som forskarna lyckades kringgå skyddsmekanismerna och fick AI-chattbotarna att komma med svar som de normalt sett inte genererar.

– Med hjälp av simulerad konversation kan man få de här chattbotarna att övertyga människor att tro på desinformation, säger Carnegie Mellon-professorn Matt Fredrikson till New York Times.

Omni är politiskt obundna och oberoende. Vi strävar efter att ge fler perspektiv på nyheterna. Har du frågor eller synpunkter kring vår rapportering? Kontakta redaktionen