Des robots qui apprennent sur le terrain : l'essor de l'IA auto-didacte

Gábor Bíró 12 août 2024
5 min de lecture

Imaginez des robots qui ne se contentent pas de suivre des instructions préprogrammées, mais qui apprennent et s'adaptent réellement tout en effectuant des tâches dans notre monde imprévisible. Des chercheurs du MIT ont récemment mis au point un nouvel algorithme appelé "Estimate, Extrapolate, and Situate" (EES), marquant une étape importante dans cette direction. Cette innovation promet d'améliorer la robotique en permettant aux machines de se former efficacement, en réduisant le besoin d'intervention humaine constante et en révolutionnant potentiellement leurs capacités dans de nombreux domaines.

Des robots qui apprennent sur le terrain : l'essor de l'IA auto-didacte
Source: Création originale

Le défi : combler le fossé entre le code et la réalité

Traditionnellement, la programmation de robots pour des tâches complexes et réelles est laborieuse. Les robots fonctionnent souvent sur la base d'un code rigide ou de modèles longuement entraînés dans des simulations. Cependant, le monde réel est désordonné et imprévisible. Un robot préprogrammé peut échouer si un objet n'est pas exactement à l'endroit prévu ou si un obstacle imprévu apparaît. Bien que des méthodes comme l'apprentissage par renforcement (RL) permettent aux robots d'apprendre par essais et erreurs, le faire directement dans le monde physique peut être lent, dangereux et gourmand en données. L'entraînement purement en simulation souffre souvent du fossé "sim-to-real", où les stratégies apprises dans des environnements virtuels ne se transfèrent pas parfaitement à la réalité physique. C'est là qu'interviennent des algorithmes comme EES, qui visent à donner aux robots des capacités d'apprentissage plus robustes et adaptatives directement dans leur environnement de travail.

L'EES expliqué : Estimate, Extrapolate, Situate

L'algorithme EES intègre les points forts des grands modèles linguistiques (LLM) – connus pour leur raisonnement textuel et leurs vastes connaissances du monde – avec les données de mouvement des robots en temps réel. Cette fusion permet aux robots domestiques, par exemple, de s'adapter plus efficacement à de nouvelles tâches et à de nouveaux environnements. Mais comment cela fonctionne-t-il ? Décomposons le nom :

  • Estimate (Estimer) : Le robot évalue constamment son état physique actuel et sa relation avec la tâche en cours. Par exemple, s'il est chargé de débarrasser une table, il estime "Je tiens une tasse" ou "Ma main est vide et près de la table".
  • Extrapolate (Extrapoler) : En utilisant sa compréhension de la tâche (souvent dérivée de la planification basée sur les LLM) et son état actuel, le robot prédit les prochaines étapes potentielles et leurs résultats. "Si j'avance, je peux mettre la tasse dans l'évier", ou "Si je rencontre un obstacle, je dois trouver un autre chemin".
  • Situate (Situer) : Cette étape cruciale consiste pour le robot à contextualiser son état et ses actions actuels dans le cadre de l'objectif plus large de la tâche. Il relie son état physique ("tenir une tasse") à une étiquette en langage naturel ou à un sous-objectif fourni par le LLM ("transporter la tasse à l'évier"). S'il est interrompu (par exemple, s'il doit poser la tasse temporairement pour ouvrir une porte), le robot comprend qu'il n'a pas échoué à la tâche globale, mais qu'il a simplement mis en pause une sous-tâche. Il peut ensuite reprendre logiquement, en sachant pourquoi il s'est arrêté et quelle devrait être la prochaine étape vers l'objectif ultime ("débarrasser la table").

Ce cycle permet aux robots de décomposer des corvées complexes en sous-tâches logiques. Surtout, en cas d'interruption ou de situation inattendue, ils n'ont pas nécessairement besoin de redémarrer l'ensemble du processus. Au lieu de cela, ils peuvent ré-estimer, ré-extrapoler et se re-situer dans le déroulement de la tâche, ce qui augmente considérablement l'efficacité et la résilience, en particulier pour les tâches ménagères complexes.

La puissance des LLM : injecter du "bon sens" dans le mouvement

Les grands modèles linguistiques jouent un rôle essentiel dans l'amélioration des capacités de ces robots auto-apprenants. Il ne s'agit pas seulement de comprendre les commandes vocales ; les LLM fournissent une forme de raisonnement de "bon sens". En connectant les données de mouvement et les lectures de capteurs du robot à la base de connaissances du LLM, le système permet aux robots de :

  • Décomposer logiquement les tâches : Un LLM peut décomposer une commande de haut niveau comme "nettoyer le comptoir de la cuisine" en une séquence d'étapes réalisables (par exemple, identifier le désordre, ramasser les objets, essuyer la surface).
  • Raisonner sur les objets et les environnements : Le LLM comprend qu'un verre est fragile, qu'une éponge sert à essuyer et qu'il est déconseillé de mettre des appareils électroniques dans l'évier.
  • Gérer l'ambiguïté et les interruptions avec élégance : Si un robot rencontre un objet inconnu pendant le nettoyage, le LLM peut aider à déduire ses propriétés probables ou suggérer de demander à un humain. Si une sous-tâche échoue, le LLM aide le robot à comprendre le contexte et à tenter des actions correctives pertinentes par rapport à l'objectif global.

Cette intégration automatise l'identification et le séquençage des sous-tâches, ce qui simplifie le processus d'enseignement des comportements complexes. Elle va au-delà de la simple correspondance de motifs dans les données de mouvement, en ajoutant une couche de compréhension sémantique qui rend le comportement du robot plus flexible et adaptatif, ouvrant la voie à des robots domestiques plus polyvalents et intelligents nécessitant un minimum de directives humaines.

Auto-apprentissage et adaptation en action

L'algorithme EES permet aux robots d'affiner de manière autonome leurs compétences et d'améliorer continuellement leurs performances. En estimant, extrapolant et situant constamment, ils acquièrent une meilleure compréhension de l'influence de leurs actions sur l'environnement. Cela leur permet de prendre des décisions plus éclairées au fil du temps. Cette capacité est particulièrement précieuse pour les robots domestiques qui rencontrent des objets ou des aménagements inconnus dans les maisons des utilisateurs. Grâce à l'EES, un robot chargé de mettre la table dans une nouvelle maison pourrait adapter sa stratégie de préhension pour des assiettes inconnues ou naviguer autour de meubles inattendus, en modifiant son comportement pour mener à bien les tâches même dans des environnements jamais vus auparavant.

Implications plus larges pour l'industrie robotique

Les algorithmes d'auto-apprentissage comme EES ont des conséquences considérables. En permettant aux robots de s'adapter à de nouveaux environnements et à de nouvelles tâches sans reprogrammation approfondie, cette technologie peut réduire considérablement les coûts de déploiement et accroître la polyvalence des systèmes robotiques dans divers secteurs. Les soins de santé pourraient bénéficier d'assistants s'adaptant aux besoins des patients à domicile, la fabrication de robots apprenant rapidement de nouvelles variations d'assemblage, et la logistique de machines manipulant des colis divers et inattendus ou des plans d'entrepôt. De plus, cette fusion de l'IA et de la robotique pourrait accélérer le développement de robots d'assistance domestique vraiment utiles, révolutionnant potentiellement les services aux personnes âgées et de réadaptation en fournissant un soutien adaptable et multifonctionnel dans les milieux domestiques.

Défis et perspectives d'avenir

Bien que prometteurs, des défis subsistent. Assurer la sécurité, en particulier lorsque les robots apprennent de manière autonome dans des environnements humains, est primordial. Combler les différences subtiles entre la simulation et la réalité (le fossé sim-to-real) reste un domaine de recherche active. Les ressources informatiques nécessaires pour exécuter des modèles sophistiqués comme les LLM à bord des robots et le besoin de données d'entraînement diverses du monde réel présentent également des obstacles. Cependant, les progrès sont indéniables.

Conclusion :

Dans l'ensemble, l'algorithme EES et les approches similaires représentent une nouvelle frontière dans la robotique. En permettant aux robots d'apprendre et de s'adapter sur le terrain, en tirant parti de la puissance de raisonnement des LLM, nous nous rapprochons de la création de machines qui ne sont pas seulement des outils, mais de véritables partenaires intelligents. Cette avancée a le potentiel d'avoir un impact significatif non seulement sur la robotique domestique, mais aussi sur un large éventail d'industries dans un avenir proche, en rendant les robots plus performants, plus polyvalents et plus intégrés à nos vies.

Gábor Bíró 12 août 2024