Ils ne peuvent plus vivre sans la fonction négligée des lunettes intelligentes

Les sous-titres sont devenus un « plug-in » pour les gens modernes. Les déplacements sont bruyants et il est facile de révéler vos secrets lorsque vous essayez d'attraper quelque chose, et vous serez distrait lorsque vous étudiez. Ce n'est qu'en utilisant à la fois l'écoute et l'observation que vous pourrez éviter que la barre de progression ne soit vaine.

Cependant, pour certains, les sous-titres sont bien plus que la cerise sur le gâteau.

Lorsque le protagoniste masculin de "Le joueur incontrôlable" a mis ses lunettes, il a vu des informations qui étaient à l'origine imperceptibles et n'étaient plus un PNJ passif.

En réalité, il existe également une sorte de lunettes intelligentes qui peuvent fournir un « barrage ambulant ». Bien qu’il s’agisse moins de science-fiction, cela mène également à un monde avec plus d’informations.

Je peux voir ce que tu as dit

L’importance de la technologie est que lorsque Dieu ferme une porte, il ouvre une fenêtre.

La vidéo de déballage d'un blogueur malentendant a reçu 800 000 likes sur TikTok. Son souhait de longue date s'est réalisé et il a pleuré de joie. La puissance de l'émotion la plus pure a ému le public qui ne l'avait jamais rencontré auparavant.

▲ Photo de : TikTok@chrissymarshall_

Elle tenait une boîte à la main, riant et pleurant en même temps. Elle fit des gestes en langage des signes et essaya de prononcer une phrase complète : « J'attends la technologie dans cette boîte depuis de nombreuses années.

La boîte contient des lunettes de sous-titres, qui ressemblent à des lunettes ordinaires, mais lui permettent de « voir » les sons autour d'elle. Ces sons qu'elle ne pouvait pas entendre dans le passé se sont transformés en lignes de sous-titres vert vif, semblables à ceux de la science-fiction. .

Selon les informations contenues dans la vidéo, les lunettes utilisées par ce blogueur s'appellent Hearview, spécialement conçues pour les malentendants. Elles ont été lancées en mai de cette année. Elles proviennent d'une entreprise technologique nationale, mais elles ne sont pas destinées aux personnes malentendantes. utilisation et le marché est à l’étranger.

Il peut être utilisé pour se divertir, regarder des films, des vidéos et regarder le jeu en direct de « Black Myth : Wukong ».

À en juger par la vidéo d'expérience du visionnage de « Friends », le texte est légèrement en retard mais précis, et l'application mobile couplée peut également distinguer différents locuteurs.

Dans le même temps, il peut également être utilisé dans des conversations en face à face pour faciliter les personnes malentendantes qui commandent de la nourriture au restaurant, font leurs achats dans les supermarchés, discutent avec des guides d'achat et naviguent en conduisant…

Le principe de HearView n'est pas compliqué : il s'associe à l'application mobile, capte le son via le microphone du smartphone et utilise l'algorithme d'IA pour convertir la parole en texte en temps réel, et les sous-titres sont affichés sur les lunettes.

Si les malentendants ont besoin de répondre aux autres, ils peuvent saisir un message dans l'application et convertir le texte en parole. Les sous-titres antérieurs sont également enregistrés dans l'application.

HearView affirme que sa précision parole-texte atteint 95 % et qu'il peut transcrire la parole jusqu'à 10 mètres de distance. À ce stade, une question se pose : les performances se détérioreront-elles dans des environnements bruyants tels que les marchés humides ?

Bien que HearView ait déclaré que l'application mobile dispose d'une fonction de suppression du bruit, j'ai parcouru diverses vidéos d'expérience et je n'ai pas pu trouver de mesures réelles dans un environnement bruyant, il est donc difficile d'explorer l'effet.

Le site officiel ne mentionne que quelques informations sur les paramètres. Il a une autonomie de 7 heures et pèse 52 grammes. Il peut être porté toute la journée. Il est également équipé de vibrations et d'avertissements visuels pour rappeler aux utilisateurs les dangers possibles.

Il est léger et durable, et il semble que cela vaut la peine d'être acheté, mais il est si cher qu'il est difficile de se faire des amis – 1 799 dollars, soit environ 12 800 yuans.

De plus, Hearview a encore beaucoup à faire. Actuellement, il ne prend en charge que l'anglais et l'espagnol, et prévoit de prendre en charge l'allemand et le français. Il ne peut pas encore réaliser de traduction mutuelle entre les langues.

La couleur du texte est uniquement d'un vert vif, ce qui garantit la lisibilité sur une variété d'écrans et de conditions d'éclairage. Cependant, l'utilisateur n'a pas le choix, ce qui est un problème.

Mais l’existence signifie la valeur. Les sous-titres font depuis longtemps partie de la vie de nombreuses personnes. Cela ne suffit pas. Ils doivent être accompagnés par ceux qui en ont le plus besoin sous une forme plus pratique et intuitive.

Bien qu'il existe de nombreuses lunettes de sous-titres, il y a plus de défis dans la vie

Les lunettes de sous-titrage en temps réel n'ont rien de nouveau il y a deux ans, elles étaient même à la mode. De nombreux projets intéressants ont été lancés, mais il est difficile pour eux d'être parfaits.

La startup britannique XRAI a développé XRAI Glass, une application de synthèse vocale compatible avec une variété de lunettes AR.

Cependant, un journaliste du magazine Wired a mis des lunettes AR compatibles avec XRAI Glass et a constaté que même si la conversion voix-texte est bonne, il y a toujours des frictions d'une sorte ou d'une autre pendant l'utilisation.

Tout d’abord, en termes d’expérience utilisateur, si vous portez des implants cochléaires et des appareils auditifs, il peut être inconfortable de porter des lunettes. Bien que ces lunettes AR soient déjà très légères, elles restent plus épaisses que les lunettes ordinaires.

De plus, la synthèse vocale ne fonctionne pas bien lorsqu’il y a un bruit de fond fort ou lorsque de nombreuses personnes parlent, ce qui réduit considérablement son aspect pratique.

Le prix est également un problème. Les lunettes AR coûtant plus de 300 dollars américains ont déjà fait mal au portefeuille. XRAI Glass nécessite également un abonnement mensuel de plusieurs dizaines de dollars, on peut seulement dire que c'est le cas. n'est pas surprenant.

Il existe également un produit similaire à Hearview en Chine : les lunettes de sous-titres d'écoute de Liangliang Vision, qui sont divisées en une version pour aide auditive et une version de traduction, qui peuvent comprendre le mandarin, les dialectes et les langues étrangères, et prendre en charge la traduction multilingue.

Son utilisation est similaire à Hearview. Téléchargez l'application Translator, associez les lunettes à votre téléphone via Bluetooth, connectez-vous à Internet via Wi-Fi ou un point d'accès, convertissez la parole en texte en temps réel sur le téléphone et affichez le texte sur le téléphone. lunettes.

Cependant, certains utilisateurs ont signalé dans l’App Store que les auditeurs ne disposent toujours pas d’une prise en charge suffisante des dialectes. Il s'agit d'une direction d'optimisation très nécessaire mais difficile. Les personnes âgées qui ont une mauvaise audition et sont habituées à parler en dialectes ont le plus besoin de ce type de produit.

Certains blogueurs YouTube ont également fait remarquer que le taux de reconnaissance vocale de l'auditeur est élevé et que la vitesse est également rapide, mais que si l'accent est fort, le taux de reconnaissance deviendra plus faible.

▲Photo de : YouTube@Technology Assistant

Si l’on ne s’en tient pas à la forme des lunettes, un prototype de produit conçu par des étudiants de l’université de Yale et de l’université de Stanford est très intéressant, baptisé Transcribe Glass.

Il ne s'agit pas d'une paire de lunettes, mais d'un affichage tête haute qui s'enclenche sur la monture des lunettes et fonctionne immédiatement, connectant l'appareil à une application compagnon pour iOS et Android, permettant aux utilisateurs de choisir leur conversation préférée. logiciel de texte.

Les sous-titres générés sont transmis à l'appareil via Bluetooth Low Energy et superposés en temps réel au champ de vision réel de l'utilisateur. Ce qui est rare, c'est que le prix est extrêmement attractif à 95 $, mais même la version bêta est toujours sur la liste d'attente et aucune information sur son lancement n'est disponible jusqu'à présent.

En plus des produits axés sur la synthèse vocale, les lunettes intelligentes AR multifonctionnelles pour tous incluent souvent également des fonctions de sous-titres.

Les lunettes intelligentes sans fil tout-en-un, dont le prix se situe entre 2 000 et 3 000 RMB en Chine, prennent essentiellement en charge la conversion parole-texte et la traduction en temps réel dans plusieurs langues, mais l'efficacité de la traduction n'est peut-être pas aussi bonne que celle des lunettes AR conçues pour l'audition. altérée Lorsque la fonction parole-texte est activée en permanence, la durée de vie de la batterie est également un problème.

Lorsque j'ai demandé une marque de lunettes intelligentes pour la tête, la réponse que j'ai obtenue était "déconseillée aux personnes malentendantes".

▲Le 22 octobre, consulté le service client d'une marque de lunettes connectées

En fait, ce type de produit convient particulièrement aux grands fabricants, en particulier Google, qui possède une solide expertise technique dans les domaines de la reconnaissance vocale, de la traduction automatique et de la RA, et qui est très en avance dans les capacités de conversion parole-texte et de traduction en temps réel.

Lors d'I/O en 2022, Google a lancé des lunettes AR traduisables en temps réel, prenant en charge 24 langues et même l'American Sign Language. Les sous-titres sont juste à côté de l'interlocuteur, mais ce n'est qu'un prototype de démonstration et il y en a. aucun suivi.

La technologie pour le bien est la prémisse principale des lunettes de sous-titres. Toutes sortes de « pinaillages » sont en fait d'humeur ardente, en espérant que le produit ne se contentera pas du statu quo, continuera à évoluer, recommencera, l'améliorera à nouveau et devenir meilleur.

Les sous-titres sont un droit, vois le monde comme si tu regardais un film

Selon les statistiques de l'Organisation mondiale de la santé, environ 466 millions de personnes dans le monde souffrent de perte auditive, dont plus de 9 millions sont profondément sourdes.

Même si elles utilisent des implants cochléaires ou des appareils auditifs, les personnes malentendantes ont toujours besoin de se concentrer pour comprendre ce que disent les autres. En même temps, certains mots ayant une prononciation similaire sont difficiles à distinguer par la seule lecture labiale. Dans des conditions idéales, seulement environ. 40 % des mots en anglais Les informations vocales peuvent être capturées par les mouvements des lèvres de l'orateur.

C’est pourquoi un monde malentendant a besoin de mots en complément. Quelqu’un a travaillé dur pour cela il y a longtemps.

L'acteur cubano-américain du cinéma muet Emerson Romero, également malentendant, a été le pionnier des sous-titres pour les films parlants en 1947.

À l'ère du cinéma muet, le public pouvait comprendre l'histoire à travers les images du film et le texte inséré. Cependant, lorsque les films parlants sont apparus, de nombreux spectateurs malentendants comme lui ont perdu l'occasion de regarder le film parce qu'ils n'entendaient pas les répliques et que le film manquait de sous-titres. .

Romero a donc décidé de créer ses propres sous-titres à la main : comme les films de l'époque étaient diffusés sur pellicule, il découpait le film et insérait des images sous-titrées entre les images.

La technologie de sous-titrage ultérieure peut être considérée comme une continuation de l'esprit de Romero. Dans le même temps, il existe de plus en plus de modèles permettant aux personnes malentendantes de regarder des films. Par exemple, certains cinémas américains proposent des lunettes avec des sous-titres prédéfinis.

En 2012, Sony a lancé des lunettes de sous-titres CC pour certains cinémas. Contrairement aux sous-titres ordinaires, les sous-titres CC incluent non seulement du contenu de dialogue, mais également des informations non verbales, telles que de la musique de fond, des effets sonores et des sons environnementaux.

Les lunettes comportent de petits projecteurs de chaque côté et les sous-titres verts semblent flotter devant le grand écran.

Le public peut clairement voir les sous-titres, peu importe où il se trouve dans la salle. Les utilisateurs peuvent également régler la luminosité, la distance d'affichage et l'angle des sous-titres, et basculer entre six langues.

Les lunettes prennent même en charge la 3D, les utilisateurs n’ont donc pas besoin de porter une paire de lunettes supplémentaire pour regarder des films en 3D. Ceci est important pour éviter une situation où l'arête du nez est très sollicitée : regarder des films tout en portant des lunettes ordinaires, des lunettes 3D et des lunettes de sous-titres CC en même temps.

▲ Photo de : Reddit@ellowTonkaTrunk, publiée en 2022

Cette scène est quelque peu ironique, mais elle ressemble à une métaphore : pour comprendre le monde d'un point de vue ordinaire, certaines personnes doivent toujours payer plus.

Les lunettes de sous-titrage en temps réel, qui ne sont pas encore parfaites mais prometteuses pour l'avenir, nous permettent au moins d'entrevoir une merveilleuse possibilité.

Bong Joon-ho, le réalisateur du film coréen "Parasite", a déclaré un jour aux Oscars : "Une fois que vous aurez surmonté la barrière des sous-titres d'un pouce de hauteur, vous verrez d'autres films merveilleux."

Lorsque les sous-titres courants dans les films apparaissent dans la vie, cela permet aux personnes qui en ont besoin de voir plus d'informations et d'avoir le droit de ne pas quitter la conversation.

Il y a une phrase dans la vidéo promotionnelle des lunettes Translate AR de Google qui est très touchante : Je te regarde directement dans les yeux, et tu sembles me regarder directement dans les yeux.

Il n'y a presque aucun sentiment d'existence, ce qui est le meilleur état de la technologie.

Dans le but d'assurer l'efficacité et la précision, la communication peut revenir à la nature. Il n'est pas nécessaire d'occuper les deux mains, pas besoin de baisser la tête pour regarder le téléphone portable et pas besoin de regarder les lèvres tout le temps. , face à face et contact visuel, tout comme ce qui existait il y a des milliers d'années.

Il est aussi vif que le gel d’automne et peut conjurer les désastres maléfiques. E-mail professionnel : [email protected]

# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo