Anthropic vill lära Claude att vara ”god” och inte ... utplåna mänskligheten
Techbolaget Anthropic har släppt en uppdaterad ”konstitution” för språkmodellen Claude, skriver Axios. Det handlar om ett 80 sidor långt dokument som redogör för Claudes ”etiska karaktär” och ”kärnidentitet”.
Den så kallade konstitutionen ersätter det som internt tidigare har kallats för ett ”själ-dokument” och som i praktiken var en lista med etiska principer.
Nu anser bolaget att det är viktigt för AI-modeller att ”förstå varför vi vill att de ska uppträda på ett visst sätt snarare än bara hur de ska göra”. I korthet ska Claude kunna göra situationsanpassade omdömen utifrån vad som är ansvarsfullt och hjälpsamt.
Tanken är att Claude ska agera till stora delar som en autonom entitet som förstår sig själv och sin plats i världen – och inte utplåna mänskligheten, som The Verge uttrycker det.