Facebook améliore les descriptions d’images AI pour les utilisateurs malvoyants

Facebook a apporté des améliorations majeures au modèle d'IA qu'il utilise pour aider les aveugles et les malvoyants à identifier les images sur la plateforme. Les mises à jour de cet outil d'intelligence artificielle l'ont rendu encore plus fiable en fournissant des descriptions précises des images.

Facebook dévoile la «nouvelle génération» de texte alternatif automatique

Dans un article de blog À propos de Facebook , Facebook a décrit les modifications apportées à son outil d'IA d'identification d'images. Facebook appelle cette technologie le texte alternatif automatique (AAT).

En relation: La nouvelle IA de Facebook traduit entre 100 langues

Ce système d'IA a été déployé à l'origine en 2016 et a depuis permis aux malvoyants d'entendre les descriptions d'images générées par l'IA à l'aide de lecteurs d'écran. Maintenant, Facebook présente "la prochaine génération" d'AAT.

Facebook a amélioré le nombre d'éléments et de concepts que son IA peut reconnaître de manière fiable. Il a également travaillé pour rendre ces descriptions plus spécifiques, car l'IA peut désormais reconnaître les animaux, les activités et les points de repère sur une photo. À titre d'exemple, une description pourrait se lire: "Peut-être un selfie de 2 personnes, à l'extérieur, la tour penchée de Pise."

L'outil AI peut même identifier l'emplacement de la position et la taille des éléments d'une photo. Cela permet à l'outil de peindre une meilleure image de ce à quoi ressemble réellement la photo. Auparavant, le système se limitait à fournir des descriptions vagues qui n'incluaient pas la position des personnes et des objets dans une image.

Facebook a atteint ce nouveau niveau de détail en utilisant un modèle «formé sur des données faiblement supervisées sous la forme de milliards d'images publiques Instagram et de leurs hashtags». Cela permet à l'IA de reconnaître avec précision plus de 1200 concepts, ce qui est bien plus que ce que l'outil d'origine pourrait faire.

Malgré cette précision améliorée, Facebook laisse toujours place à l'erreur. C'est pourquoi la phrase «peut être» précède chaque description de photo, juste au cas où l'outil signale de manière inexacte le contenu de l'image.

Facebook a noté l'impact positif que cette mise à jour aura sur la communauté, déclarant:

Ces avancées aident les utilisateurs aveugles ou malvoyants à mieux comprendre le contenu des photos publiées par leur famille et leurs amis – et dans leurs propres photos – en fournissant des informations plus détaillées (et plus détaillées).

Ouvrir la voie à l'accessibilité en ligne

Le nouvel outil d'IA amélioré de Facebook est prometteur pour la croissance des outils d'accessibilité sur le Web et établit une nouvelle norme d'accessibilité sur les médias sociaux. Espérons que d'autres plates-formes mettront en œuvre un outil similaire, car ce serait une aide considérable pour les utilisateurs malvoyants.