Effektivitets- och säkerhetstesterna som många techbolag lutar sig mot håller inte alltid måtten, enligt brittiska forskare. (Shutterstock)

Forskare varnar för brister i techbolagens AI-tester

Av Mikaela Åkerman
Publicerad: 4 nov. 2025

Forskare har hittat allvarliga brister i hundratals tester som används för att bedöma säkerheten och effektiviteten hos nya AI-modeller, rapporterar The Guardian. Enligt en studie från forskare vid Storbritanniens institut för AI-säkerhet och flera ledande universitet har nästan alla de 440 granskade testerna svagheter som kan göra resultaten missvisande.

Tester av det här slaget används ofta av stora techbolag för att visa att deras modeller är säkra och fungerar som tänkt. Men enligt forskarna bakom studien riskerar de bristande metoderna att skapa en falsk bild av framstegen inom AI.

– Utan gemensamma definitioner och tillförlitliga mätmetoder är det svårt att veta om modellerna faktiskt blir bättre eller bara verkar bli det, säger huvudförfattaren Andrew Bean.

Granskningen publiceras samtidigt som oro växer kring snabb lansering av nya modeller

www.theguardian.com

Bakom studien står Storbritanniens statliga AI Security Institute (AISI)

www.aisi.gov.uk

Open AI har meddelat att man samarbetar med AISI för att stärka säkerheten i sina system (12 september)

openai.com

The Guardian nämner bland annat fallet med en amerikansk senator som anklagat Googles AI Gemma för allvarliga brister

The Verge

Annons

Jämför bredband på din adress – hitta bästa priset och sänk kostnaden

Bredbandsval

Omni är politiskt obundna och oberoende. Vi strävar efter att ge fler perspektiv på nyheterna. Har du frågor eller synpunkter kring vår rapportering? Kontakta redaktionen

Lärare kritiserar AI-robot i skolan: ”Otroligt olämpligt”

En humanoid robot, tillsammans med en AI-driven lärarassistent, håller på att introduceras i en gymnasieskola i delstaten New York, rapporterar The Guardian.

2 tim

En humanoid robot från Realbotix på en mässa i januari.

Anthropic lanserar ny AI-modell för fjärde gången på två månader

Anthropic har lanserat en ny AI-modell för fjärde gången på två månader, skriver Mashable.

I dag 13.17

Människor passerar en reklamskylt under Anthropics utvecklarkonferens ”koda med Claude”

Dansk artist måste bevisa att nysläppt låt inte är AI

Den danska artisten Astrid Engberg har fått ett krav på sig från det franska distributionsföretaget Believe att bevisa att hennes nya singel inte är gjord med AI. Det skriver DR.

I går 14.52

Microsoft byter ut Open AI:s bildmodeller mot egna

Microsoft ersätter Open AI:s modeller för bildgenerering med egenutvecklad teknik i tjänster som Powerpoint och Bing, skriver Bloomberg.

23 juli, 21.41

Utvecklingen av AI Artificiell intelligens Data, it & högteknologi Datasäkerhet