ChatGPT : l’IA a-t-elle été entraînée avec des livres piratés ?

DeChoses à Savoir TECH

Commencer à écouter Voir l'émission du podcast

ChatGPT : l’IA a-t-elle été entraînée avec des livres piratés ?

DeChoses à Savoir TECH

évaluations:

Longueur:

3 minutes

Sortie:

4 juil. 2023

Format:

Épisode de podcast

Description

OpenAI, la startup ayant créé le désormais célèbre ChatGPT, est accusée par deux écrivains de vol de contenu pour entraîner leur IA. Les artistes reprochent aux développeurs des modèles de langages utilisés par le chatbot nourrir leur technologie avec sources normalement payantes. Alors que les grandes entreprises de la Silicon Valley cherchent à tirer profit de l'intelligence artificielle, les auteurs des "sources" originales risquent de ne recevoir aucune compensation financière malgré leur contribution essentielle, car c’est bien sur des sources principalement écrites que les IA s'entraînent.
Selon Torrent Freak que je cite, "cette semaine, les auteurs Paul Tremblay et Mona Awad ont intenté une action collective contre OpenAI, accusant la société mère de ChatGPT de violation des droits d'auteur. Selon eux, ChatGPT a été partiellement formé à partir de leurs œuvres protégées par le droit d'auteur, sans autorisation" fin de citation. L'accusation est grave, mais comment les plaignants peuvent-ils être si certains qu'OpenAI a formé son chatbot à partir de leurs œuvres ? Pour Paul Tremblay et Mona Awad, la preuve est évidente, je les cite, "ChatGPT génère des résumés des œuvres protégées des plaignants, ce qui ne serait possible que si ChatGPT avait été formé sur ces œuvres" fin de citation.
Cependant, l'accusation ne s'arrête pas là. Toujours selon les deux auteurs, OpenAI aurait également utilisé du contenu provenant de sites de piratage de livres tels que Z-Library. Bien que l'entreprise reste évasive sur l'origine des sources ayant servi à former son IA, il est connu que ChatGPT a été entraîné avec au moins 360 000 livres. Est-ce que l'entreprise a payé pour "s'inspirer" de ces œuvres ? Seule l’entreprise peut le dire, mais les plaignants soulignent néanmoins que "OpenAI a dû utiliser des ressources piratées, car je cite "il n'existe pas de bases de données légitimes contenant autant de livres" fin de citation.
Learn more about your ad choices. Visit megaphone.fm/adchoices

Sortie:

4 juil. 2023

Format:

Épisode de podcast

Titres dans cette série (100)

Tout ce qu'il faut savoir dans le domaine de la Tech et d'Internet.

Ignorer le carrousel

Plus d'épisodes de Choses à Savoir TECH

Ignorer le carrousel

Épisodes de podcast liés

Ignorer le carrousel

Découvrez ce podcast, et bien plus encore

ChatGPT : l’IA a-t-elle été entraînée avec des livres piratés ?

ChatGPT : l’IA a-t-elle été entraînée avec des livres piratés ?

Description

Titres dans cette série (100)

Plus d'épisodes de Choses à Savoir TECH

Épisodes de podcast liés