Comment fonctionnent les applications de traduction de la parole de chat?

Vous avez probablement vu des applications qui prétendent traduire ce que dit votre chat. Mais peuvent-ils vraiment traduire le miaulement de votre chat en anglais? La réponse courte est oui, en quelque sorte. C'est difficile en raison de l'unicité de la «langue» de chaque chat, mais ils peuvent se rapprocher de la technologie moderne.

Les applications de traduction de chat comme MeowTalk utilisent une forme de reconnaissance vocale qui met l'accent sur l'apprentissage automatique. Regardons de plus près.

Reconnaissance vocale et apprentissage automatique

La reconnaissance vocale fonctionne en enregistrant la parole et en transformant l'audio en un fichier de données numériques. Il encode des données telles que la hauteur et le volume en tant que points de données que l'application peut analyser et faire correspondre avec des significations. DPA Microphones explique que ces points de données peuvent être très différents en fonction des sons de fond et de la façon dont un mot est prononcé.

Nous prenons parfois la reconnaissance vocale pour acquise, mais c'est un exploit technologique incroyable. Surtout compte tenu de la complexité de la parole humaine. Comme l'explique The Scientist , chaque mot implique une large gamme de sons ou de "phonèmes" mélangés les uns aux autres. Obtenir un ordinateur pour comprendre la parole est très difficile. La nouvelle frontière des sons de chat sera encore plus difficile.

Les applications qui utilisent la reconnaissance vocale sont programmées avec un «vocabulaire» de mots appelé ensemble de données. L'application associe ensuite votre discours à l'option la plus proche de son vocabulaire de données.

Lorsqu'il fait une erreur, vous la corrigez et il enregistre ces données pour la prochaine fois. Cela fait partie de l'apprentissage automatique. C'est ainsi qu'un programme apprend à reconnaître la parole même si elle n'est pas identique à l'ensemble de données avec lequel il a commencé.

Connexes: Que sont les algorithmes d'apprentissage automatique? Voici comment ils fonctionnent

La reconnaissance vocale a encore des problèmes, en particulier avec les obstacles à la parole et les accents. Cependant, certaines entreprises améliorent l'apprentissage automatique pour surmonter ces problèmes . Au fil du temps, l'apprentissage automatique peut transformer la reconnaissance vocale en un outil puissant.

C'est ainsi que fonctionne la reconnaissance vocale pour les humains. Mais ça marche pour les chats?

Reconnaissance vocale vs reconnaissance Meow

Premièrement, nous devons comprendre pourquoi la traduction d'un certain type de miaulement par «j'ai faim» est différente de l'analyse de la parole humaine. Le problème est principalement que la communication du chat repose davantage sur des signaux non verbaux comme la posture. Un autre problème est l'absence d'un «langage des chats» universel.

Selon l' ASPCA , les chats sauvages adultes ne miaulent jamais entre eux, seulement contre les gens. D'autres recherches de la Humane Society ajoutent que ces sons «ne se produisent pas dans le vide». Nous devons les interpréter parallèlement au langage corporel et à d'autres contextes. Dans de nombreux cas, ces signaux silencieux sont la seule différence entre un miaulement qui signifie «j'ai faim» et un autre qui signifie «je veux jouer».

Ajoutant à ce problème, deux chats n'ont pas la même langue. Les chats développent des «langages» personnalisés pour leurs propriétaires. Ceux-ci sont en partie basés sur l'imitation de la voix du propriétaire et en partie sur la personnalité du chat. Il n'y a pas deux chats identiques, même lorsqu'ils expriment le même désir ou le même besoin. Alors, comment le vocabulaire vocal d'une application peut-il se traduire pour tous?

Apprentissage automatique flexible pour les chats

Bien que quelques assistants virtuels comme Oto tentent de comprendre le ton et les émotions, la reconnaissance vocale est toujours terrible pour les signaux non verbaux. Mais cela ne veut pas dire qu'il est impossible de les interpréter.

MeowTalk utilise un type d'apprentissage automatique plus flexible pour aider à surmonter ces problèmes.

Télécharger: MeowTalk pour Android | iOS (gratuit)

Meowtalk a été créé par Javier Sanchez, qui a également travaillé dans l'équipe Alexa. Il a imaginé l'application comme une étape vers des colliers intelligents. Ces colliers traduiraient les sons des chats en paroles humaines, s'appuyant sur des stratégies d'apprentissage automatique complexes pour aider les humains à mieux comprendre et prendre soin de leurs chats.

L'équipe MeowTalk a compensé les problèmes d'unicité en créant des profils plus spécifiques pour chaque chat. Dans l'application, vous enregistrez chaque chat séparément. Science Norway rapporte que les chatons miaulent différemment des chats adultes, de sorte que l'application demande également l'anniversaire du chat. Chaque profil génère un réseau de données unique pour le chat, intégrant un peu d'apprentissage en profondeur dans l'apprentissage automatique.

En relation: Deep Learning vs Machine Learning vs AI: comment vont-ils ensemble?

Pour le vocabulaire, MeowTalk commence avec 10 profils sonores dans son jeu de données. Chacun a une signification différente attachée, comme «heureux» ou «chasse». Lorsque l'application entend un son et se trompe, vous pouvez le corriger ou créer une nouvelle interprétation.

La correction indique à l'application de remplacer le vocabulaire de base par le nouveau son.

Par exemple, vous pouvez dire à l'application de faire correspondre "Hunting" à de courts gazouillis au lieu d'un long hurlement. Ce type de correction est plus utile que l'ajout de plusieurs sons pour correspondre à l'un d'eux, ce qui reviendrait à dire à l'application qu'un long hurlement et un bip court signifient tous deux "Mother Call".

L'apprentissage automatique dans les applications de reconnaissance vocale résiste généralement à ce type d'écrasement. Ce serait comme essayer d'enseigner à Siri que lorsque vous dites «blog technologique», vous voulez vraiment dire «poire». Mais la forme plus flexible d'apprentissage automatique qu'utilise MeowTalk peut gérer cette correction plus facilement.

La création d'une nouvelle interprétation ajoute une signification qui n'a pas été précédemment encodée. Par exemple, si votre chat reçoit un appel spécifique lorsqu'il veut son jouet préféré, vous pouvez ajouter "Je veux ma souris" en option. Cela revient à ajouter un mot à votre dictionnaire de correction automatique.

En relation: Comment définir vos propres mots de correction automatique sur Android

Au fil du temps, vous pouvez développer un profil de parole hautement personnalisé pour votre chat. Finalement, il pourrait même être suffisamment sophistiqué pour être utile aux gardiens d'animaux ou pour résoudre des problèmes de comportement. Si rien d'autre, cela aide les propriétaires de chats à devenir plus attentifs à leurs animaux de compagnie.

Le verdict: les applications de traduction Cat fonctionnent-elles?

En fin de compte, la "traduction de chat" repose toujours beaucoup sur l'utilisateur qui enseigne à l'application comment son chat parle. Ce sera probablement toujours le cas en raison de l'unicité de la communication de chaque chat.

Mais le fait que l'apprentissage automatique soit arrivé si loin que les développeurs puissent même y réussir partiellement est incroyable. L'apprentissage automatique et l'intelligence artificielle progressent à une vitesse vertigineuse, et nous avons hâte de voir où ils vont ensuite.