Incident 996: translated-fr-Meta Allegedly Used Books3, a Dataset of 191,000 Pirated Books, to Train LLaMA AI
Description: translated-fr-Meta and Bloomberg allegedly used Books3, a dataset containing 191,000 pirated books, to train their AI models, including LLaMA and BloombergGPT, without author consent. Lawsuits from authors such as Sarah Silverman and Michael Chabon claim this constitutes copyright infringement. Books3 includes works from major publishers like Penguin Random House and HarperCollins. Meta argues its AI outputs are not "substantially similar" to the original books, but legal challenges continue.
Entités
Voir toutes les entitésAlleged: Various generative AI developers , Meta , EleutherAI , Bloomberg , The Pile et Shawn Presser developed an AI system deployed by Various generative AI developers , Meta , EleutherAI et Bloomberg, which harmed Zadie Smith , Writers , Verso , Stephen King , Sarah Silverman , Richard Kadrey , Publishers found in Books3 , Penguin Random House , Oxford University Press , Over 170,000 authors found in Books3 , Michael Pollan , Margaret Atwood , Macmillan , HarperCollins , General public , Creative industries , Christopher Golden et Authors.
Systèmes d'IA présumés impliqués: The Pile , LLaMA , hugging face , GPT-J , Books3 , BloombergGPT et Bibliotik
Statistiques d'incidents
ID
996
Nombre de rapports
2
Date de l'incident
2020-10-25
Editeurs
Dummy Dummy
Rapports d'incidents
Chronologie du rapport
/cdn.vox-cdn.com/uploads/chorus_asset/file/24778390/668894138.jpg)
Mise à jour à 13h40 HE le 25 septembre 2023
Note de la rédaction : Cet article fait partie de la série de The Atlantic consacrée à Books3. Consultez notre base de données consultable Books3 pour trouver des auteurs et des titres spécifiques…
Variantes
Une "Variante" est un incident de l'IA similaire à un cas connu—il a les mêmes causes, les mêmes dommages et le même système intelligent. Plutôt que de l'énumérer séparément, nous l'incluons sous le premier incident signalé. Contrairement aux autres incidents, les variantes n'ont pas besoin d'avoir été signalées en dehors de la base de données des incidents. En savoir plus sur le document de recherche.
Vous avez vu quelque chose de similaire ?