Derrière l’explosion de ChatGPT, ceux qui l’ont aidé à « laver le blanc »


Le succès de l'intelligence artificielle n'est pas seulement dû aux génies au sommet de la pyramide.

L'IA ne reconnaît pas les objets et nécessite beaucoup de données pour apprendre à distinguer les traits du visage et les feux de signalisation.

L'IA ne refuse pas l'information, s'appuyant sur les humains pour l'aider à éliminer les parties nuisibles de la base de données.

Lorsque l'IA brille enfin sous les projecteurs, les annotateurs de données accomplissent leurs tâches monotones mais importantes, puis s'estompent dans le noir.

ChatGPT, qui est populaire dans le monde entier, est probablement aussi une histoire de "un réussira et tous mourront".

"Les héros dans les coulisses" de ChatGPT

Il va sans dire à quel point ChatGPT est puissant. Il vous parle en langage naturel, écrit du code, rédige des articles, passe des examens et crée de la poésie.

Par rapport au précédent "retard mental artificiel", GPT-3, le prédécesseur de ChatGPT, est également une grande amélioration, mais il a un problème qu'il est facile de laisser échapper la violence, le sexisme et les remarques racistes, il ne peut donc pas être vraiment vulgarisé .

Avec les leçons tirées du passé, afin de s'assurer que ChatGPT est doux et inoffensif, OpenAI a mis en place un mécanisme de sécurité supplémentaire.

▲ Photo de : shutterstock

Sur la base d'exemples impliquant la violence, la haine et les abus sexuels, il forme une IA capable de détecter le contenu préjudiciable, puis utilise cette IA comme détecteur, intégré à ChatGPT, pour détecter et filtrer le contenu avant qu'il n'atteigne les utilisateurs.

Les exemples ci-dessus doivent passer par l'étiquetage des données (étiquetage des données), qui est un énorme travail humain, et les travailleurs au Kenya sont responsables de l'étiquetage des contenus préjudiciables.

Depuis novembre 2021, OpenAI a envoyé des dizaines de milliers de fragments de texte à la société de sous-traitance Sama, dont la plupart reflètent les coins les plus sombres d'Internet, impliquant des abus sexuels, des suicides, des tortures, etc.

▲ Photo de : Sama

Un étiqueteur de données a commencé à avoir des hallucinations récurrentes après avoir lu un contenu inacceptablement nocif.

La charge de travail n'a pas été échangée contre un traitement supérieur.

L'enquête Time a révélé que les étiqueteurs de données Sama qui travaillent pour OpenAI gagnent environ 1,32 $ à 2 $ de l'heure. Travaillant par quarts de neuf heures, ils ont lu et annoté 150 à 250 paragraphes de texte, allant de 100 mots à plus de 1 000 mots chacun.

Mais Sama dit que les travailleurs peuvent annoter 70 paragraphes par quart de travail de neuf heures, au lieu du maximum de 250, et gagner entre 1,46 $ et 3,74 $ de l'heure après impôts.

Sama se décrit également comme une "entreprise d'IA éthique" qui a sorti plus de 50 000 personnes de la pauvreté.

Si être moral signifie aider à sortir de la pauvreté, alors peut-être qu'il n'y a rien de mal à cela, après tout, ces pauvres travailleurs n'ont pas plus d'options.

Mais les « effets secondaires » sont comme une ombre, et la torture physique et mentale est devenue un prix nécessaire.

Parce que Sama a des exigences extrêmement élevées en matière d'efficacité au travail des employés, l'entreprise organise rarement des activités de conseil psychologique, sans compter que ces activités elles-mêmes ne sont d'aucune utilité. Certains employés ont proposé d'avoir des consultations individuelles, mais la direction de Sama a refusé à plusieurs reprises.

OpenAI a également répondu au média étranger Quartz qu'ils payaient presque deux fois plus que les autres sociétés de révision de contenu en Afrique de l'Est et offraient aux employés des avantages sociaux et des pensions.

Bien que les parties aient des opinions différentes, les faits fondamentaux ne sont pas différents.

Afin de rendre l'IA plus sûre et de faire en sorte que l'IA générale d'OpenAI profite à l'humanité, un grand nombre de travailleurs ont dépensé beaucoup d'énergie et ont même subi des traumatismes. Mais quand OpenAI était évalué à près de 30 milliards de dollars, ils restaient largement inconnus.

capillaires terminaux

Les étiqueteurs de données ne sont pas un nouveau travail.

Dès 2007, l'expert en vision par ordinateur Fei-Fei Li a embauché un groupe d'étudiants de premier cycle de Princeton pour expérimenter l'étiquetage des données pour 10 $/heure.

Aujourd'hui, l'étiquetage des données est déjà devenu une industrie, mais le salaire a considérablement baissé et les protagonistes ne sont plus des étudiants.

Vers 2019, certains médias ont fait état d'étiqueteurs de données nationaux dispersés dans des villes de quatrième et cinquième rangs du Henan, du Shandong, du Hebei et d'autres endroits.

De même, Sama a son siège social à San Francisco et emploie du personnel au Kenya, en Ouganda et en Inde. En plus d'OpenAI, il étiquette également les données des clients de la Silicon Valley tels que Google, Meta et Microsoft.

Cependant, ces deux dernières années, Sama a décidé de "se laver les mains dans le bassin d'or".

En février 2022, Sama a décidé de mettre fin à sa coopération avec OpenAI. Les employés n'ont plus à endurer la douleur, mais les moyens de subsistance sont également difficiles à maintenir. "Pour nous, c'est une façon de soutenir notre famille."

En janvier de cette année, l'attitude de Sama a été encore plus décisive : il prévoyait d'arrêter tout travail de traitement du langage naturel et de révision de contenu, de ne faire que de l'annotation de données de vision par ordinateur et de se séparer de toutes les entreprises impliquant des contenus sensibles, notamment en résiliant le contrat avec Meta en Afrique de l'Est.

Le personnel de Sama, qui travaille pour Meta, dans son bureau de Nairobi en Afrique, se concentre sur l'examen du contenu produit localement, les décapitations, la maltraitance des enfants, etc. sont plus qu'ils ne peuvent gérer. Un employé a décrit l'examen du contenu des images comme "vivant dans un film d'horreur".

Là où il y a une demande, il y a un marché, et il n'y a jamais de pénurie de telles entreprises d'externalisation.

Majorel, une société d'externalisation basée au Luxembourg responsable des services de modération de TikTok en Afrique, serait sur le point de reprendre le travail de Meta.

L'entreprise a également été critiquée. En août 2022, Insider a enquêté sur la situation à Majorel, au Maroc, et a constaté que les travailleurs travaillaient souvent en équipes pendant plus de 12 heures, marquaient de courtes vidéos impliquant de la cruauté envers les animaux, des violences sexuelles, etc., et avaient moins de temps de repos que leurs homologues américains. Le « consultant en santé » de l'entreprise a aidé Rien à faire.

En tant que capillaires à la fin de la chaîne de l'industrie technologique, l'annotation des données apparaît à plus d'endroits.

En novembre 2022, The Verge a rapporté qu'Amazon avait embauché des travailleurs en Inde et au Costa Rica chargés de regarder des milliers de vidéos à partir de caméras d'entrepôt pour améliorer le système de vision par ordinateur d'Amazon.

▲ Photo de : Reuters

Mais après l'avoir regardé pendant au moins huit heures, ils ont développé des maux de tête, des douleurs oculaires et une perte de vision.

Les voitures autonomes ont également besoin d'un étiquetage des données pour apprendre à reconnaître les panneaux de signalisation, les véhicules, les piétons, les arbres et les poubelles.Cela nécessite une précision d'étiquetage encore plus élevée, car il peut déterminer directement la vie et la mort des personnes.

Une enquête du MIT Technology Review d'avril 2022 a révélé que des entreprises autonomes, dont Tesla, avaient des travailleurs vénézuéliens annotant des données sur la conduite autonome pour un salaire moyen d'un peu plus de 90 cents de l'heure.

Au moins pour l'instant, la base de données a encore besoin d'être purifiée par l'homme, et la reconnaissance de cartes par IA a toujours besoin d'êtres humains pour dessiner le cadre. Le problème est que par rapport à l'énergie qu'ils y mettent, le traitement et la santé mentale des travailleurs ne sont pas si idéaux.

ceux qui deviennent de plus en plus marginaux

Depuis la naissance de ChatGPT, de nombreuses personnes se sont inquiétées pour leur travail, ce qui peut être un sentiment de crise très particulier.

Dans le même temps, la relation entre l'IA et les humains a subi des changements subtils dans une autre dimension – elle a changé la façon dont les humains travaillent et les types d'emplois qui existent, permettant à un grand nombre d'ouvriers de se cacher dans les coulisses.

Par exemple, les étiqueteurs de données, dont le seuil d'emploi n'est pas élevé, n'ont souvent pas d'exigences académiques strictes et peuvent être embauchés après quelques jours de formation. Si vous savez ce qu'il faut marquer et où le marquer , vous êtes en train de commencer, et le reste du temps est laissé à la pratique rend parfait.

Ce ne sont souvent pas des employés réguliers, mais des formes externalisées, comme les travailleurs kenyans au service d'OpenAI.

Cela signifie qu'ils vivent dans un monde plus instable, avec des salaires inférieurs, un statut plus marginal et moins de voix sur le lieu de travail, juste après. Jusqu'où va l'IA, ils ne le savent peut-être pas.

En 2018, le rapport de GQ mentionnait dans "Ceux qui travaillent pour l'intelligence artificielle" : "Nous n'avons aucune capacité de recherche et développement, et nous sommes purement une (fonderie) Foxconn."

▲ Mouvement Luddite.

Des situations similaires se sont produites dans l'histoire. En Grande-Bretagne, au début du XIXe siècle, les machines textiles automatisées sont devenues populaires et les usines ont préféré embaucher de la main-d'œuvre non qualifiée bon marché pour faire fonctionner les machines, ce qui a entraîné le chômage de nombreux ouvriers qualifiés.

La roue du temps continue d'avancer et les étiqueteurs de données au service de l'IA sont lentement remplacés par l'IA.

En juin 2022, Tesla prévoit de licencier 200 employés américains chargés d'annoter les vidéos et d'aider à améliorer les systèmes d'assistance à la conduite. La raison peut être que l'étiquetage automatisé des données de Tesla a progressé ces dernières années, ce qui peut remplacer une partie du travail effectué par les humains.

Le directeur du logiciel de Tesla Autopilot a déclaré un jour lors de la Journée de l'IA que l'entreprise pouvait collecter et étiqueter automatiquement 10 000 clips vidéo de 45 à 60 secondes en une semaine. En revanche, "l'étiquetage manuel de chaque segment peut prendre des mois".

En 2020, le Forum économique mondial a prédit que d'ici 2025, 85 millions d'emplois seront remplacés par des machines et 97 millions de nouveaux emplois seront créés.

Les postes pour lesquels ils sont optimistes sont essentiellement des talents techniques tels que des experts en intelligence artificielle et en apprentissage automatique, des experts en transformation numérique et des analystes de la sécurité de l'information.

En revanche, les métiers peu rémunérés et peu qualifiés se retirent progressivement de la scène, et pourraient à terme disparaître dans l'ombre des machines.

Il est aussi bénéfique que le gel d'automne et peut éliminer les catastrophes maléfiques. Courriel professionnel : [email protected]

#Bienvenue pour prêter attention au compte public WeChat officiel d'Aifaner : Aifaner (WeChat ID : ifanr), un contenu plus excitant vous sera présenté dès que possible.

Ai Faner | Lien d'origine · Voir les commentaires · Sina Weibo