Wikipédia collabore avec Big Tech sur des accords similaires à son accord avec Google, a déclaré mercredi Jimmy Wales, co-fondateur de l'encyclopédie en ligne, dans le but d'aider l'entreprise à monétiser la forte dépendance des entreprises d'IA à l'égard de son contenu.

Dans une interview lors du sommet Reuters NEXT à New York, au Pays de Galles, a déclaré que l'utilisation par les entreprises technologiques des connaissances gratuites de Wikipédia pour former leurs grands modèles de langage entraînait une augmentation des coûts que l'opérateur à but non lucratif de Wikipédia devait assumer.

« Les robots IA qui explorent Wikipédia parcourent l'intégralité du site… Nous avons donc besoin de plus de serveurs, de plus de RAM et de mémoire pour la mise en cache, et cela nous coûte un montant disproportionné », a déclaré Wales.

Même si le contenu de Wikipédia reste gratuit pour les personnes sous licence, l'accès automatisé et à grand volume par des entités à but lucratif est une autre affaire, a déclaré Wales. Il a souligné qu'un accord avait déjà été signé avec Alphabet et que des discussions avec d'autres sociétés étaient toujours en cours.

La Fondation Wikimedia, qui gère Wikipédia, a conclu un accord avec Google en 2022 pour que le géant de la technologie paie l'accès à la formation au contenu de Wikipédia, qui constitue une partie cruciale des données détenues par des sociétés comme OpenAI et Meta Platforms.

La principale source de revenus de la fondation réside dans les petits dons du public, qui, selon Wales, ne sont pas destinés à financer le développement de produits commerciaux d'IA valant des milliards de dollars.

« Wikipédia est soutenu par des bénévoles. Ces gens donnent de l'argent pour soutenir Wikipédia, et non pour subventionner OpenAI, ce qui nous coûte une fortune. Cela ne me semble pas juste », a déclaré Wales.

La pression pour davantage de licences place le plus grand référentiel mondial de connaissances gratuites dans une confrontation potentielle avec l'industrie en plein essor de l'IA. Cela soulève des questions fondamentales quant à savoir qui devrait supporter le coût des vastes ensembles de données à l’origine de la révolution de l’IA et si les entreprises à but lucratif ont l’obligation de compenser les sources publiques et à but non lucratif qui les aident à développer leur technologie.

Lorsqu'on lui a demandé si Wikipédia intenterait des poursuites judiciaires contre les sociétés d'IA qui utilisent son contenu sans payer pour l'accès à la formation, Wales a répondu : « Je ne sais pas. J'ai l'impression que notre capacité de soft power à leur faire honte est probablement assez puissante. »

Le Pays de Galles a déclaré que Wikipédia pourrait également envisager d'utiliser des mesures techniques telles que le contrôle d'exploration de l'IA de Cloudflare, qui permet aux clients de limiter quand et comment les robots IA qui exploitent Internet peuvent accéder à leur contenu. Il a reconnu que cela pourrait créer un dilemme, compte tenu de l'engagement idéologique de Wikipédia en faveur du libre accès au savoir, mais a souligné que le fardeau financier devait être abordé.

La Fondation Wikimedia gère Wikipédia depuis plus de deux décennies en tant qu'organisation à but non lucratif, s'appuyant sur une communauté mondiale d'éditeurs bénévoles et de dons publics pour fournir des informations gratuites.

Malgré son succès, la plateforme a toujours eu du mal à maintenir un point de vue neutre, notamment sur les questions politiques et sociales controversées. Wales a noté que, même si la grande majorité des rédacteurs ne sont pas des militants, il est difficile de rester calmement neutre lors de conflits mondiaux majeurs, mais que la communauté « a tendance à faire du bon travail même dans ces circonstances ».

A lire également