Anthropics nya säkerhetsplan ska skydda mot AI-risker

Av Mats Karlsson
Publicerad: 16 okt. 2024

AI-företaget Anthropic (mest känt för den populära chattboten Claude) har uppdaterat sin säkerhetsplan Responsible Scaling Policy (RSP) på ett sätt som ska minska de potentiella riskerna med högpresterande AI-system. Det rapporterar Venturebeat.

Policyn introducerades redan 2023, men har nu stärkts med nya protokoll som ska säkerställa att AI-modeller utvecklas och driftsätts på ett säkert sätt, även när de blir mer kraftfulla. Policyn innehåller nu bland annat ett antal trösklar som indikerar när en AI-modell nått en nivå som kräver extra säkerhet.

”Anthropics proaktiva agerande signalerar en växande medvetenhet i AI-industrin när det handlar om behovet av att balansera snabb innovation med en robust säkerhetsstandard” skriver Venturebeat.

Olika trösklar signalerar nu om behovet av extra säkerhetsåtgärder

venturebeat.com

Ska minska riskerna med högpresterande AI-system

www.platformer.news

Annons

Betalar du för mycket för bredband? Jämför priser på Bredbandsval och sänk din kostnad

Bredbandsval

Omni är politiskt obundna och oberoende. Vi strävar efter att ge fler perspektiv på nyheterna. Har du frågor eller synpunkter kring vår rapportering? Kontakta redaktionen

Ledare: Politikerna pratar inte om AI – det är för deprimerande

Det är fortfarande den senaste tidens stora politiska avslöjanden som tar upp merparten av utrymmet på ledarsidorna, men på torsdagen har också en liten text om AI lyckats ta sig in.

I går 12.36

En man vinkar till en AI-version av Nvidia-chefen Jensen Huang.

Matematiker oroliga när AI knäcker värstingproblem

En grupp med 16 framstående matematiker har lanserat ett upprop som varnar för hur AI riskerar att förändra matematikens villkor, rapporterar New York Times. Uppropet går under namnet Leidendeklarationen och kommer efter att Open AI använt en AI-modell för att lösa ett 80 år gammalt matematiskt problem.

5 juni, 09.12

Instagramkonton kapade med hjälp av Metas AI-support

Hackare säger sig ha kunnat kapa Instagramkonton genom att be Metas egen AI-supportchatt om hjälp, rapporterar 404 Media. Metoden gick ut på att angriparen helt enkelt bad chattboten att koppla en ny mejladress till ett visst användarnamn.

2 juni, 09.10

Källor: Walmart tvingas ransonera AI till anställda

Walmart begränsar de anställdas användning av AI-verktyget Code Puppy efter hög efterfrågan, uppger källor för Bloomberg. Tidigare hade medarbetarna obegränsad tillgång, men får nu en bestämd mängd AI-tokens för att använda verktyget.

1 juni, 21.52

Utvecklingen av AI Anthropic It, Informationsteknologi Artificiell intelligens Data, it & högteknologi