Découvrez ce podcast, et bien plus encore

Profitez gratuitement des podcasts sans abonnement. Nous offrons également des livres électroniques, des livres audio et bien plus encore, pour seulement $11.99/mois.

ChatGPT : l’IA a-t-elle été entraînée avec des livres piratés ?

ChatGPT : l’IA a-t-elle été entraînée avec des livres piratés ?

DeChoses à Savoir TECH


ChatGPT : l’IA a-t-elle été entraînée avec des livres piratés ?

DeChoses à Savoir TECH

évaluations:
Longueur:
3 minutes
Sortie:
4 juil. 2023
Format:
Épisode de podcast

Description

OpenAI, la startup ayant créé le désormais célèbre ChatGPT, est accusée par deux écrivains de vol de contenu pour entraîner leur IA. Les artistes reprochent aux développeurs des modèles de langages utilisés par le chatbot nourrir leur technologie avec sources normalement payantes. Alors que les grandes entreprises de la Silicon Valley cherchent à tirer profit de l'intelligence artificielle, les auteurs des "sources" originales risquent de ne recevoir aucune compensation financière malgré leur contribution essentielle, car c’est bien sur des sources principalement écrites que les IA s'entraînent.
Selon Torrent Freak que je cite, "cette semaine, les auteurs Paul Tremblay et Mona Awad ont intenté une action collective contre OpenAI, accusant la société mère de ChatGPT de violation des droits d'auteur. Selon eux, ChatGPT a été partiellement formé à partir de leurs œuvres protégées par le droit d'auteur, sans autorisation" fin de citation. L'accusation est grave, mais comment les plaignants peuvent-ils être si certains qu'OpenAI a formé son chatbot à partir de leurs œuvres ? Pour Paul Tremblay et Mona Awad, la preuve est évidente, je les cite, "ChatGPT génère des résumés des œuvres protégées des plaignants, ce qui ne serait possible que si ChatGPT avait été formé sur ces œuvres" fin de citation.
Cependant, l'accusation ne s'arrête pas là. Toujours selon les deux auteurs, OpenAI aurait également utilisé du contenu provenant de sites de piratage de livres tels que Z-Library. Bien que l'entreprise reste évasive sur l'origine des sources ayant servi à former son IA, il est connu que ChatGPT a été entraîné avec au moins 360 000 livres. Est-ce que l'entreprise a payé pour "s'inspirer" de ces œuvres ? Seule l’entreprise peut le dire, mais les plaignants soulignent néanmoins que "OpenAI a dû utiliser des ressources piratées, car je cite "il n'existe pas de bases de données légitimes contenant autant de livres" fin de citation.
Learn more about your ad choices. Visit megaphone.fm/adchoices
Sortie:
4 juil. 2023
Format:
Épisode de podcast

Titres dans cette série (100)

Tout ce qu'il faut savoir dans le domaine de la Tech et d'Internet.