Anthropics nya säkerhetsplan ska skydda mot AI-risker
AI-företaget Anthropic (mest känt för den populära chattboten Claude) har uppdaterat sin säkerhetsplan Responsible Scaling Policy (RSP) på ett sätt som ska minska de potentiella riskerna med högpresterande AI-system. Det rapporterar Venturebeat.
Policyn introducerades redan 2023, men har nu stärkts med nya protokoll som ska säkerställa att AI-modeller utvecklas och driftsätts på ett säkert sätt, även när de blir mer kraftfulla. Policyn innehåller nu bland annat ett antal trösklar som indikerar när en AI-modell nått en nivå som kräver extra säkerhet.
”Anthropics proaktiva agerande signalerar en växande medvetenhet i AI-industrin när det handlar om behovet av att balansera snabb innovation med en robust säkerhetsstandard” skriver Venturebeat.