Anthropic vill lära Claude att vara ”god” och inte ... utplåna mänskligheten

Av Helena Sällström
Publicerad: 22 jan.

Techbolaget Anthropic har släppt en uppdaterad ”konstitution” för språkmodellen Claude, skriver Axios. Det handlar om ett 80 sidor långt dokument som redogör för Claudes ”etiska karaktär” och ”kärnidentitet”.

Den så kallade konstitutionen ersätter det som internt tidigare har kallats för ett ”själ-dokument” och som i praktiken var en lista med etiska principer.

Nu anser bolaget att det är viktigt för AI-modeller att ”förstå varför vi vill att de ska uppträda på ett visst sätt snarare än bara hur de ska göra”. I korthet ska Claude kunna göra situationsanpassade omdömen utifrån vad som är ansvarsfullt och hjälpsamt.

Tanken är att Claude ska agera till stora delar som en autonom entitet som förstår sig själv och sin plats i världen – och inte utplåna mänskligheten, som The Verge uttrycker det.

Läs hela konstitutionen (pdf)

www-cdn.anthropic.com

Sammanfattning av Claudes nya konstitution

pressmeddelande · www.anthropic.com

Kan bli en konkurrensmässig fördel över modeller som Chat GPT och Gemini

The Verge

Anthropic har samarbetat med experter från områden där AI kan utgöra en risk

www.axios.com

Konstitutionen avslutas med ett ifrågasättande av chattbotens eventuella samvete: ”Moralisk status är högst oklar”

techcrunch.com

Filosof: ”Om din sexåring visar sig vara ett geni kan du inte lura den”

time.com

Annons

Betalar du för mycket för bredband? Jämför priser på Bredbandsval och sänk din kostnad

Bredbandsval

Omni är politiskt obundna och oberoende. Vi strävar efter att ge fler perspektiv på nyheterna. Har du frågor eller synpunkter kring vår rapportering? Kontakta redaktionen

Ledare: Politikerna pratar inte om AI – det är för deprimerande

Det är fortfarande den senaste tidens stora politiska avslöjanden som tar upp merparten av utrymmet på ledarsidorna, men på torsdagen har också en liten text om AI lyckats ta sig in.

11 juni, 12.36

En man vinkar till en AI-version av Nvidia-chefen Jensen Huang.

Matematiker oroliga när AI knäcker värstingproblem

En grupp med 16 framstående matematiker har lanserat ett upprop som varnar för hur AI riskerar att förändra matematikens villkor, rapporterar New York Times. Uppropet går under namnet Leidendeklarationen och kommer efter att Open AI använt en AI-modell för att lösa ett 80 år gammalt matematiskt problem.

5 juni, 09.12

Instagramkonton kapade med hjälp av Metas AI-support

Hackare säger sig ha kunnat kapa Instagramkonton genom att be Metas egen AI-supportchatt om hjälp, rapporterar 404 Media. Metoden gick ut på att angriparen helt enkelt bad chattboten att koppla en ny mejladress till ett visst användarnamn.

2 juni, 09.10

Källor: Walmart tvingas ransonera AI till anställda

Walmart begränsar de anställdas användning av AI-verktyget Code Puppy efter hög efterfrågan, uppger källor för Bloomberg. Tidigare hade medarbetarna obegränsad tillgång, men får nu en bestämd mängd AI-tokens för att använda verktyget.

1 juni, 21.52

Utvecklingen av AI Anthropic Artificiell intelligens