Bandeau
mcInform@ctions
Travail de fourmi, effet papillon...
Descriptif du site
Actualitté
Où sont passées les bases de données illégales d’OpenAI ?
#IA #ChatGPT #Midjourney #OpenAI #exploitation
Article mis en ligne le 17 mai 2024
dernière modification le 9 mai 2024

OpenAI avait d’abord résisté à la demande de l’Authors Guild, en mettant en avant des questions de confidentialité, avant de révéler que ces données, qui n’étaient plus utilisées depuis la fin de l’année 2021, avaient été supprimées courant 2022.

L’entreprise a par ailleurs affirmé que ces données n’avaient pas été utilisées pour former les derniers modèles d’IA à disposition du public — comprendre ChatGPT 3.5 et 4. OpenAI a alors demandé au tribunal de maintenir sous scellé les informations concernant ces bases de données, ainsi que le nom des deux employés qui en sont à l’origine, et qui aujourd’hui ne travaillent plus pour la start-up. L’Authors Guild s’est opposé à cette demande, arguant du droit du public à être informé.

Quelques gros auteurs — parmi lesquels G.R.R. Martin, Jodi Picoult, John Grisham ou encore Jonathan Franzen — s’étaient alliés à l’Authors Guild dans son combat. Ces derniers s’estiment lésés par l’utilisation, non autorisée et ne donnant lieu à aucune compensation, qui est faite de leur travail protégé par le copyright.

La start-up est également soupçonnée de s’être servie dans des répertoires illicites d’œuvres, comme la plateforme pirate Z-Library, pour remplir ses différentes bases de données servant à l’entrainement des outils d’intelligence artificielle.

Une pluie de procès pour les IA (...)

En décembre, le New York Times venait ajouter son grain de sel, accusant OpenAI d’avoir utilisé sans autorisation une quantité d’articles du journal, toujours pour l’entrainement ses technologies d’intelligence artificielle.

Sans oublier la lettre ouverte à destination de OpenAI (concepteur de ChatGPT), Alphabet (maison-mère de Google), Meta (celle de Facebook), Stability AI (derrière Stable Diffusion), IBM et Microsoft, publiée en juillet par l’Authors Guild, et signée entre autres par Dan Brown, James Patterson, Jennifer Egan, Suzanne Collins, Margaret Atwood, Jonathan Franzen, Roxane Gay, Celeste Ng, Louise Erdrich, Viet Thanh Nguyen ou encore George Saunders.

10.000 écrivains y parlaient d’une seule voix pour dénoncer l’usage qui était fait de leurs écrits. (...)

En janvier, dans le cadre d’un questionnaire de la Chambre des Lords du Royaume-Uni, OpenAI admettait qu’« il serait impossible d’entraîner les modèles d’IA leaders d’aujourd’hui sans utiliser de matériaux protégés par le droit d’auteur ».

La défense des entreprises qui développent des modèles d’intelligence artificielle repose alors sur une spécificité du droit américain, le fair use. Elle permet l’utilisation, dans certaines circonstances, de contenu protégé sans en demander la permission du propriétaire. (...)

Et c’est sans doute, en partie, pour se préparer à une issue défavorable dans ses différents procès qu’OpenAI commence à s’ouvrir à la conclusion d’accord avec différents acteurs du monde de l’édition et de la presse. (...)