Le Sud

Dans une comparaison sociologique des conditions de travail des producteurs d’IA, des chercheurs rappellent le rôle majeur des travailleurs des données. En mettant en parallèle des situations observées au Venezuela, au Brésil, à Madagascar et en France, ils montrent que ce domaine maintient « les dépendances économiques historiques et génère des inégalités qui s’ajoutent à celles héritées du passé ».
Les entreprises d’IA génératives s’appuient sur un amas de données pour créer de modèles de plus en plus gros. Cette course commence à montrer ses limites, mais OpenAI, Anthropic et leurs concurrents ne l’ont pas abandonnée pour l’instant.
Pour obtenir ces amas de données, il faut : soit se procurer des corpus déjà existants, soit générer des contenus à la pelle. Pour la première solution, si ces entreprises ont facilement sacrifié le Copyright sur l’autel de l’IA sans que cela n’émeuve trop les politiques, les archives déjà créées comme « The Pile » vont commencer à se tarir. Et les entreprises de l’industrie culturelle ont lancé quelques procès qui devraient refroidir d’éventuel nouveaux créateurs d’archives de ce genre.
Pour générer des contenus à la pelle, rien de mieux que l’IA générative qui fait ça en quelques claquements de doigts. Mais, on a vu que si ces entreprises parient sur l’entrainement en utilisant des données synthétiques, ça pourrait devenir le talon d’Achille de leurs outils.
Mais, contrairement à ce qu’on pourrait imaginer parfois derrière nos machines, les entreprises d’IA n’ont pas seulement besoin du travail des scientifiques et ingénieurs qu’elles mettent en avant. Leurs outils ne pourraient pas voir le jour sans le travail essentiel de petites mains qui étiquettent des images, trient des items dans des listes, enregistrent des extraits audio ou en retranscrivent via des plateformes comme Amazon Mechanical Turk, Microworkers, Clickworker ou Yappers (anciennement Foule Factory) en France. Next en a déjà parlé quelques fois.
Nous avons aussi vu que certains d’entre eux utilisent eux-mêmes massivement les grands modèles de langage pour accomplir leurs tâches.
Des journalistes, mais aussi des sociologues comme Antonio Casilli, ont permis de mettre au jour ce travail quotidien qui participe à l’existence des IA. Mais il est encore difficile d’appréhender comment fonctionne le marché mondial des « data workers ».
Comparer le profil des data workers du Venezuela, du Brésil, de Madagascar et de France
Ces derniers font partie des millions de « travailleurs à la demande en ligne » qui existent à travers le monde. Un rapport [PDF] de la Banque mondiale publié l’année dernière estime leur nombre dans une fourchette de 154 millions à 435 millions de travailleurs, soit entre 4,4 % à 12,5 % de la main-d’œuvre mondiale.