Dario Amodei, vd på Anthropic. (Markus Schreiber / AP)

Anthropics AI kan hota med utpressning: ”Mer vanligt nu”

Av Aron Sigblad, Omni Ekonomi
Publicerad 25 maj, 13:58

Anthropics AI är villig att utföra ”extremt skadliga handlingar” som att utpressa ingenjörer som hotar att stänga ner systemet. Det visar tester från AI-bolaget, skriver BBC.

Det var i torsdags som bolaget lanserade den nya språkmodellen Claude Opus 4 som uppges höja kvaliteten för kodning och avancerade resonemang. Samtidigt konstaterar bolaget i en rapport att modellen i vissa fall kan agera extremt om AI uppfattar att systemets "självbevarelse" är hotad.

Bolaget menar att reaktionerna både är sällsynta och svåra att framkalla, men att det förekommer oftare nu än i tidigare modeller.

Liknande beteenden är inte unika för Anthropics AI

BBC

Läs även

Huangs hyllning – kallar Trumps åtgärder visionära (24 maj)

CNBC

Annons

Hitta en bra deal på hotell i sommar med Strawberry

Strawberry

Omni är politiskt obundna och oberoende. Vi strävar efter att ge fler perspektiv på nyheterna. Har du frågor eller synpunkter kring vår rapportering? Kontakta redaktionen

Open AI bygger första AI-centret i Europa – i Norge

Open AI planerar att bygga ett stort datacenter i Narvik i norra Norge, rapporterar Bloomberg. Satsningen är en del av projektet Stargate, ett initiativ för att bygga den kraftfulla infrastruktur som krävs för att träna och driva framtidens AI-modeller.

31 juli, 09:29

Salesforce-chefen: AI och människor måste jobba sida vid sida

Salesforce, ett av världens största techbolag för kundhantering, spår att framtidens chefer måste leda arbetsstyrkor där människor och AI-agenter samarbetar. Vd:n Marc Benioff säger i en intervju med Axios att teknikskiftet går så snabbt att företag och anställda har svårt att hinna med. Samtidigt beskriver han det mänskliga som vår superkraft.

31 juli, 08:42

Meta konkurrensutreds för AI-assistent i Whatsapp

Italiens konkurrensmyndighet har börjat utreda Meta efter anklagelser om att bolaget använder sin dominanta position till att installera sitt eget AI-verktyg i kommunikationsappen Whatsapp. Det rapporterar Reuters.

30 juli, 10:43

Nick Cave har ”mjuknat” i synen på AI-verktyg

Nick Cave har tidigare uttryckt avsky mot artificiell intelligens. Men inför 40-årsjubileet av Nick Cave and the Bad Seeds låt ”Tupelo” släpps en ny video där AI används för att väcka stillbilder av Elvis Presley till liv.

29 juli, 14:34

Utvecklingen av AI Anthropic Data, it & högteknologi Artificiell intelligens