Apple och Nvidia uppges ha tränat AI på Youtubedata
Flera av världens ledande techbolag har utan att be om lov tränat sina AI-modeller på ett dataset som innehåller transkriptioner av över 173 000 Youtubeklipp. Det hävdar åtminstone sajten Proof News, som skriver att datasetet har tagits fram av ett icke vinstdrivande företag kallat Eleuther AI.
Bland de bolag som använt datasetet för träning nämns Apple, Nvidia och Anthropic. Informationen som använts till träningen består enligt uppgifterna inte av video eller bilder, utan enbart av transkriptioner av det som sägs i klippen. Innehåll från några av Youtubes mest populära innehållsskapare ska ha använts, bland annat Marques ”MKBHD” Brownlee och Mr Beast. Transkriptioner av Youtube-innehåll från New York Times, BBC och ABC News ska också ha använts.
En talesperson för Google säger till Engadget att det skulle innebära en överträdelse av Youtubes allmänna villkor om uppgifterna stämmer. Varken Apple, Nvidia eller Anthropic har kommenterat saken.