Les illusions d’optique pourraient nous aider à construire la prochaine génération d’IA
Vous regardez l'image d'un cercle noir sur une grille de points circulaires. Cela ressemble à un trou gravé dans un morceau de tissu à mailles blanches, bien qu'il s'agisse en fait d'une image plate et fixe sur un écran ou une feuille de papier. Mais votre cerveau ne le comprend pas comme ça. Comme une expérience hallucinatoire de bas niveau, votre esprit trébuche ; percevoir l'image statique comme la bouche d'un tunnel noir qui se dirige vers vous.
Répondant à la vraisemblance de l'effet, le corps commence à réagir inconsciemment : les pupilles de l'œil se dilatent pour laisser entrer plus de lumière, tout comme elles s'ajusteraient si vous étiez sur le point d'être plongé dans l'obscurité pour assurer la meilleure vision possible.
L'effet en question a été créé par Akiyoshi Kitaoka , psychologue à l'Université Ritsumeikan de Kobe, au Japon. C'est l'une des dizaines d'illusions d'optique qu'il a créées au cours d'une longue carrière. ("Je les aime tous", a-t-il déclaré, répondant à la question de Digital Trend pour savoir s'il avait un favori.)
Cette nouvelle illusion a fait l'objet d'une recherche publiée récemment dans la revue Frontiers in Human Neuroscience . Bien que l'article se concentre fermement sur les réponses physiologiques humaines au nouvel effet (dont il s'avère que quelque 86 % d'entre nous connaîtront), le sujet général peut également avoir beaucoup de pertinence lorsqu'il s'agit de l'avenir de l'intelligence artificielle – comme l'un des chercheurs s'est empressé de l'expliquer à Digital Trends.
Un avantage évolutif
Quelque chose ne va pas avec votre cerveau. Au moins, c'est une conclusion facile à tirer de la façon dont le cerveau humain perçoit les illusions d'optique. Quelle autre explication existe-t-il pour une image bidimensionnelle statique que le cerveau perçoit comme quelque chose de totalement différent ? Pendant longtemps, la psychologie traditionnelle a pensé exactement cela.
"Au départ, les gens pensaient : 'D'accord, notre cerveau n'est pas parfait… Il ne fonctionne pas toujours correctement.' C'est un échec, non ? » a déclaré Bruno Laeng , professeur au Département de psychologie de l'Université d'Oslo et premier auteur de l'étude susmentionnée. "Les illusions dans ce cas étaient intéressantes car elles révélaient une sorte d'imperfection dans la machinerie."
Les psychologues ne les voient plus ainsi. Au contraire, des recherches comme celle-ci mettent en évidence le fait que le système visuel n'est pas simplement une simple caméra. L'illusion d'optique "Illusory Expanding Hole" indique clairement que l'œil s'adapte à la lumière et à l'obscurité perçues, voire imaginées, plutôt qu'à l'énergie physique.
Plus important encore, cela montre que nous n'enregistrons pas simplement le monde avec nos systèmes visuels, mais effectuons plutôt un ensemble continu d'expériences scientifiques afin d'obtenir un léger avantage évolutif. L'objectif est d'analyser les données qui nous sont présentées et d'essayer de traiter de manière préventive les problèmes avant qu'ils ne deviennent, eh bien, des problèmes.
"Le cerveau n'a aucun moyen de savoir ce qui est [vraiment] là-bas", a déclaré Laeng. «Ce qu'il fait, c'est construire une sorte de réalité virtuelle de ce qui pourrait être là-bas. Il y a un peu de conjecture. À cet égard, vous pouvez considérer le cerveau comme une sorte de machine probabiliste. Vous pouvez l'appeler une machine bayésienne si vous le souhaitez. Il utilise une hypothèse préalable et essaie de la tester tout le temps pour voir si cela fonctionne.
Laeng donne l'exemple de nos yeux effectuant des ajustements basés sur rien de plus que l'impression de la lumière du soleil : même lorsque celle-ci est vue à travers la couverture nuageuse ou une canopée de feuilles. Au cas où.
"Ce qui compte dans l'évolution, ce n'est pas que ce soit vrai [à ce moment], mais c'est probable", a-t-il poursuivi. "En resserrant la pupille, votre corps s'adapte déjà à une situation qui est très susceptible de se produire dans un court laps de temps. Ce qui se passe [si le soleil sort soudainement], c'est que vous êtes ébloui. Ébloui signifie temporairement incapable. Cela a d'énormes conséquences, que vous soyez une proie ou un prédateur. Vous perdez une fraction de seconde dans une situation particulière et vous risquez de ne pas survivre.
Ce n'est pas seulement la lumière et l'obscurité où nos systèmes visuels doivent faire des suppositions non plus. Pensez à un jeu de tennis, où la balle se déplace à grande vitesse. Si nous fondions notre comportement entièrement sur ce que le système visuel reçoit à un moment donné, nous serions en retard sur la réalité et ne parviendrions pas à renvoyer la balle. "Nous sommes capables de percevoir le présent bien que nous soyons vraiment coincés dans le passé", a déclaré Laeng. "La seule façon de le faire est de prédire l'avenir. Cela ressemble un peu à un jeu de mots, mais c'est tout en un mot.
La vision artificielle s'améliore
Alors, qu'est-ce que cela a à voir avec la vision par ordinateur? Potentiellement tout. Pour qu'un robot, par exemple, puisse fonctionner efficacement dans le monde réel, il doit pouvoir effectuer ce type d'ajustements à la volée. Les ordinateurs ont un avantage en ce qui concerne leur capacité à effectuer des calculs extrêmement rapides. Ce qu'ils n'ont pas, ce sont des millions d'années d'évolution de leur côté.
Ces dernières années, la vision artificielle a néanmoins fait d'énormes progrès. Ils peuvent identifier des visages ou des démarches dans des flux vidéo en temps réel, potentiellement même dans de vastes foules de personnes. Des outils de classification et de technologie d'images similaires peuvent également reconnaître la présence d'autres objets, tandis que les percées en matière de segmentation d'objets permettent de mieux comprendre le contenu de différentes scènes. Des progrès significatifs ont également été réalisés en matière d'extrapolation d'images 3D à partir de scènes 2D, permettant aux machines de «lire» des informations tridimensionnelles, telles que la profondeur, à partir de scènes. Cela rapproche la vision par ordinateur moderne de la perception humaine de l'image.
Cependant, il existe toujours un fossé entre les meilleurs algorithmes de vision artificielle et les types de capacités basées sur la vision que l'écrasante majorité des humains sont capables de réaliser dès leur plus jeune âge. Bien que nous ne puissions pas articuler exactement comment nous effectuons ces tâches basées sur la vision (pour citer le polymathe hongrois-britannique Michael Polanyi, "nous pouvons en savoir plus que nous ne pouvons en dire"), nous sommes néanmoins capables d'effectuer un éventail impressionnant de tâches qui nous permettent d'exploiter notre vue de diverses manières intelligentes.
Un test de Turing pour la vision artificielle
Si les chercheurs et les ingénieurs espèrent créer des systèmes de vision par ordinateur qui fonctionnent au moins à la hauteur des capacités de traitement visuel du cerveau des wetwares, la construction d'algorithmes capables de comprendre les illusions d'optique n'est pas un mauvais point de départ. À tout le moins, cela pourrait s'avérer un bon moyen de mesurer à quel point les systèmes de vision artificielle fonctionnent avec notre propre cerveau. Ce n'est peut-être pas la réponse à la mythique intelligence artificielle générale , mais cela pourrait être la clé pour débloquer la vision générale.
"Si quelqu'un développait, un jour, un système visuel artificiel qui commet les mêmes erreurs de perception illusoires que nous, vous sauriez à ce stade qu'il [réalise] une bonne simulation du fonctionnement de notre cerveau", a déclaré Laeng. « Ce serait une sorte de test de Turing. Si vous avez un réseau artificiel qui est trompé par l'illusion comme nous le sommes, alors nous [serions] très près de comprendre le calcul sous-jacent du cerveau lui-même.
Yi-Zhe Song , lecteur de Computer Vision and Machine Learning au Centre for Vision Speech and Signal Processing de l'Université de Surrey au Royaume-Uni, est d'accord avec l'hypothèse. "Demander aux algorithmes de vision de comprendre les illusions d'optique en tant que sujet général est d'une grande valeur pour la communauté", a-t-il déclaré à Digital Trends. "Cela va au-delà de l'objectif actuel de la communauté consistant à demander aux machines de [reconnaître], en repoussant les limites [et] en demandant aux machines de raisonner. Cette poussée [représenterait] un pas en avant significatif vers la «vision générale», où les interprétations subjectives des concepts visuels doivent être prises en compte.
Utilisez votre illusion
À ce jour, il y a eu quelques recherches limitées vers cet objectif – bien qu'il reste à un stade relativement précoce. Nasim Nematzadeh, chercheur titulaire d'un doctorat. en intelligence artificielle et robotique-modèles de vision de bas niveau, est une personne qui a publié des travaux sur ce sujet .
"Nous pensons qu'une exploration plus approfondie du rôle des modèles simples de type gaussien dans le traitement rétinien de bas niveau et du noyau gaussien au stade précoce [réseaux de neurones profonds], et sa prédiction de la perte d'illusion perceptive, conduira à des techniques de vision par ordinateur plus précises. et des modèles », a déclaré Nematzadeh à Digital Trends. "[Cela pourrait] contribuer à des modèles de niveau supérieur de traitement de la profondeur et du mouvement et généralisé à la compréhension informatique des images naturelles."
Max Williams, un chercheur en intelligence artificielle qui a aidé à compiler un ensemble de données de milliers d'images d'illusions d'optique pour les systèmes de vision par ordinateur, décrit très succinctement la relation entre la vision générale et les illusions d'optique : « Les illusions existent parce que nos yeux et notre cerveau effectuent un travail désordonné et ad hoc. processus pour extraire une scène visuelle d'un champ lumineux autrement incompréhensible, créé par un monde physique dont nous sommes presque complètement isolés », ont-ils déclaré à Digital Trends. "Je ne pense pas qu'il soit possible de rendre un système visuel suffisamment expressif pour être considéré comme une" perception "qui est également exempte d'illusions."
Atteindre la vision générale
Pour être clair, atteindre une vision générale de niveau humain (ou mieux) pour l'IA ne va pas simplement les entraîner à reconnaître les illusions d'optique standard. Aucune capacité hyper-spécifique pour, disons, décoder les illusions de Magic Eye avec une précision de 99,9% en 0,001 seconde ne va se substituer à des millions d'années d'évolution humaine.
(Il est intéressant de noter que la vision artificielle a déjà sa propre version des illusions d'optique sous la forme de modèles contradictoires, ce qui peut les faire confondre – comme dans une illustration alarmante – une tortue jouet imprimée en 3D pour un fusil . Cependant, ceux-ci ne donnent pas le mêmes avantages évolutifs que les illusions d'optique qui fonctionnent sur les humains.)
Pourtant, amener les machines à comprendre les illusions d'optique humaines et à y répondre comme nous le faisons pourrait être une recherche très utile.
Et une chose est sûre : lorsque General Vision AI sera atteint, il tombera dans le même genre d'illusions d'optique que nous. Au moins, dans le cas du trou en expansion illusoire, 86% d'entre nous.