Reddit stoppar Wayback Machine från skrapning
Diskussionsforumet Reddit kommer att blockera den ideella organisationen Internet Archive från att spara större delen av sajtens innehåll via verktyget Wayback Machine, skriver The Verge.
Enligt Reddit har AI-bolag samlat in data från Wayback Machine – som används för att se hur webbsidor sett ut vid olika tidpunkter – i strid med plattformens regler. Framöver kommer endast Reddits startsida att kunna indexeras, inte enskilda inlägg, kommentarer eller profiler.
Reddit har tidigare begränsat tillgången för sökmotorer och verktyg som används för AI-träning, och i vissa fall sålt data till bolag som Google och Open AI.
bakgrund
Wayback Machine
Wikipedia (en)
The Wayback Machine is a digital archive of the World Wide Web founded by Internet Archive, an American nonprofit organization based in San Francisco, California. Launched for public access in 2001, the service allows users to go "back in time" to see how websites looked in the past. Founders Brewster Kahle and Bruce Gilliat developed the Wayback Machine to provide "universal access to all knowledge" by preserving archived copies of defunct web pages.
The Wayback Machine's earliest archives go back at least to 1995, and by the end of 2009, more than 38.2 billion webpages had been saved. As of November 2024, the Wayback Machine has archived more than 916 billion web pages and well over 100 petabytes of data.
Omni är politiskt obundna och oberoende. Vi strävar efter att ge fler perspektiv på nyheterna. Har du frågor eller synpunkter kring vår rapportering? Kontakta redaktionen