Exclusif : l’espagnol natif de Copilot « change la donne », déclare un expert Microsoft
Les marques d’IA continuent de promettre des expériences plus uniformes et plus humaines pour leurs produits, et Microsoft n’est pas différent. La marque s’efforce de rendre les fonctionnalités de son assistant IA plus cohérentes avec le monde de tous les jours. Cela inclut une voix en espagnol plus authentique pour son produit Copilot. La société a déployé sa fonctionnalité Copilot Voice en octobre dernier, qu'elle mettra bientôt à jour avec des voix natives hispanophones pour répondre aux besoins de la communauté latino-américaine aux États-Unis et dans le monde.
Entrez Elm et Alder, les voix espagnoles natives de Copilot. L'IA peut détecter quand l'espagnol est parlé et répondre de manière transparente dans un espagnol courant avec un accent natif. De même, il exprime un accent natif tout en parlant anglais dans un contexte espagnol. J'ai parlé avec un expert produit Microsoft pour explorer le processus de développement des nouvelles voix et l'intention derrière la fourniture de ce langage et de cette représentation culturelle uniques au sein de la suite IA de Microsoft.
"Sur le marché américain, vous avez tous ces horizons et ces personnes variés et diversifiés qui constituent votre public. Dans notre recherche, nous voulons être représentatifs de nos communautés", déclare Laura Parra Rangel, conceptrice de produits Microsoft AI. "Nous avons remarqué qu'il y avait un petit écart pour la communauté hispanique aux États-Unis. Il existe une énorme communauté Latinx aux États-Unis. Nous avons une énorme communauté qui peut en bénéficier."
L'impact des voix espagnoles

Copilot Voice a déjà reçu des critiques positives dans sa version anglaise, Michael Muchmore de PCMag décrivant une première expérience avec la fonction vocale AI comme « presque comme parler avec un ami ». Il a noté qu'il répondrait toujours même dans des schémas de parole normaux, comme trébucher avec la parole ou interrompre l'IA. Copilot continuera à répondre à sa requête.
Une telle fonctionnalité serait sûrement bénéfique lorsqu’elle serait implémentée dans d’autres langues de manière native. En particulier, pour un groupe démographique qui constitue collectivement le deuxième plus grand groupe ethnique aux États-Unis. Selon Census.gov, plus de 65 millions de personnes ont identifié leur appartenance ethnique comme hispanique ou latino-américaine en 2023.
"Pour moi, les expériences vocales sont incroyables. Maintenant que nous avons les options en espagnol, cela change la donne pour moi : une option espagnole vraiment décente pour vivre ces expériences. Quelque chose qui peut changer et basculer entre l'anglais et l'espagnol, tout comme je le fais dans ma vie habituelle", dit Parra Rangel.
"Je parle de quelque chose en anglais, puis quelque chose m'est venu à l'esprit en espagnol, et je passe constamment de l'un à l'autre, et je suis sûre que cela est vrai pour de très nombreuses personnes à travers le monde", a-t-elle ajouté.
Parallèlement au déploiement prochain de Copilot en langue espagnole, Microsoft a publié un rapport interrogeant 504 mères latino-américaines âgées de 25 à 40 ans sur la manière dont elles utilisent l'IA dans leur vie quotidienne. La campagne, intitulée « Abuela Approved AI », a révélé que 56 % des mères latines considèrent l'IA comme un élément de leur équipe de soutien familial proche ; 60 % des mamans incluent l'IA dans leurs tâches quotidiennes, notamment le divertissement, la croissance personnelle, le travail ou les affaires et la traduction linguistique ; 70 % des mamans déclarent qu'elles utilisent l'IA pour obtenir une assistance 24h/24 et 7j/7 plutôt que les conseils des autres, tandis que 51 % indiquent qu'elles considèrent l'IA comme une source à laquelle elles peuvent accéder pour obtenir une assistance sans jugement. Enfin, 87 % des mamans latines ont fait référence à l'IA pour l'enrichissement et la préservation de la culture, y compris les loisirs, les recettes familiales et la langue maternelle, l'IA étant un pont pour l'apprentissage d'anciens concepts et de nouveaux.
Parmi les exemples pratiques donnés par des mères latines sur la manière dont Copilot Voice leur a été bénéfique dans leur vie quotidienne, citons l'utilisation de l'application mobile pour scanner les ingrédients disponibles dans leur maison afin de créer une recette qui correspond à leur culture. Ils ont également détaillé l’utilisation d’invites en espagnol pour créer des histoires uniques, à la première personne, dans la langue maternelle, au coucher afin de promouvoir le bilinguisme et le multiculturalisme chez leurs enfants.
"Je parle couramment l'espagnol, c'est ma première langue. L'anglais est ma deuxième langue, mais je vois tout à fait les gens de la première génération aux États-Unis se dire : je veux parler espagnol. Je veux préserver ma culture. Et avoir Copilot les aide à préserver leur culture", dit-elle.
"C'est formidable d'avoir une vraie voix hispanique sur le marché à qui je peux parler et qui me semble [familière]. Avec un accent argentin ou dominicain, c'est incroyable", a-t-elle ajouté.
La voix sur toutes les plateformes

Copilot Voice a été lancé pour la première fois à l'aide du modèle d'IA GPT-4o d'OpenAI. D'autres services tels que Think Deeper de Microsoft incluent également Copilot Voice et utilisent des modèles plus puissants, tels que GPT o1 . Notamment, une fonctionnalité comme Think Deeper est principalement basée sur le Web ; cependant, les utilisateurs peuvent accéder à d'autres configurations Copilot Voice via les bureaux Microsoft Windows et macOS, ainsi que les interfaces mobiles iOS et Android .
Parra Rangel a noté que travailler avec l'équipe Microsoft AI a changé sa perspective sur la façon dont les fonctionnalités vocales pourraient être présentées. Ayant auparavant associé la voix strictement au mobile, observer le développement de Copilot Voice lui a permis de voir comment une fonctionnalité vocale peut également être compatible avec une expérience de bureau.
"Bien sûr, vous avez toujours la possibilité d'utiliser la voix sur un ordinateur de bureau. En tant que concepteur de produits, je considérais cela uniquement comme mobile, mais maintenant, cela change la donne. La façon dont nous expérimentons la voix sur toutes les plateformes, qu'il s'agisse d'un ordinateur ou d'un mobile. Ce n'est que la pointe de l'iceberg", dit-elle.
J'ai demandé à Microsoft s'il y aurait des mises à jour de modèle pour la fonctionnalité espagnole native de Copilot et j'attends une réponse. J'ai également demandé à la société si elle envisageait de publier des versions natives d'autres langues sur Copilot Voice, et elle a répondu qu'elle donnerait une réponse.
L'attrait plus large de Copilot

Alors que les marques technologiques mettent en avant les points forts des nouvelles fonctionnalités, le chef de produit a reconnu les inquiétudes potentielles des utilisateurs quant à la confiance en l'IA, notamment en matière de confidentialité, de sécurité et d'autres erreurs ou problèmes notables. Elle a noté que certaines personnes pourraient résister à l’utilisation de Copilot en raison de la stigmatisation liée à l’utilisation de l’IA qui diminue leur intelligence, ou du sentiment que l’IA pourrait leur enlever leur capacité à penser ou à créer de manière originale. Parra Rangel a déclaré que les utilisateurs peuvent considérer Copilot comme quelqu'un avec qui échanger des idées ou poser une question rapide, et non comme générer entièrement du contenu.
"Ce que Copilot a, c'est qu'il s'adresse à tous les groupes d'âge. C'est différent d'un média social plus spécialisé qui s'adresse peut-être à la génération Z, ou uniquement aux Millennials. Je pense que Copilot est super inclusif dans ce sens. Quel que soit votre âge, vous pouvez toujours bénéficier de Copilot", dit-elle.
Donnant un exemple d'une façon personnelle dont elle utilise Copilot, Parra Rangel a indiqué qu'elle profite des paramètres linguistiques transparents pour créer un outil d'apprentissage des langues intégré à l'application qu'elle peut utiliser en déplacement. Il existe un paramètre de débit de parole qui permet aux utilisateurs d'ajuster la vitesse ou la lenteur de la voix. Elle a déclaré qu'elle ralentirait la voix pour une meilleure compréhension et utiliserait Copilot Voice comme coach personnel dans la formation linguistique. Actuellement, Copilot prend en charge 40 langues, et 14 sont considérées comme très bien prises en charge.
Parra Rangel considère que l'introduction de voix natives espagnoles a le potentiel de promouvoir l'apprentissage des langues pour les utilisateurs de Copilot, qu'ils soient hispaniques ou non.
"Vous pouvez toujours bénéficier de ces voix véritablement hispanophones pour apprendre de nouvelles choses, une nouvelle langue, ou si vous souhaitez améliorer votre espagnol, ou si vous vivez dans une région diversifiée où les gens parlent espagnol ou d'autres langues. C'est une très bonne façon d'apprendre la culture et la langue de votre voisin", dit-elle.
Elle a ajouté que la seule façon de dissiper toute rumeur sur Copilot et ses fonctionnalités est de l'essayer.