Quel futur pour les chatbots ?

A la croisée des sciences linguistiques et computationnelles les chatbots, ou agents conversationnels intelligents, sont de plus en plus courants dans nos vies quotidiennes. Mais ces nouveaux assistants doivent relever de nombreux défis pour pouvoir s’installer durablement dans nos usages. Retour sur ces challenges et opportunités évoqués lors de la conférence Olivier Legrain – Intelligence Artificielle et Cognition à l’ENS Ulm avec des représentants de Google, Facebook, SAP Conversational AI, SoftBanks Robotics, Orange Labs et des Chercheurs du CNRS. 

Répondre ou Collaborer ?

Nés il y a plus de 20 ans, les premiers chatbots à application commerciales ont été conçus pour répondre à des tâches très spécifiques comme réserver un billet d’avion ou trouver un restaurant. On parle alors de “Task-oriented dialog agents” dont l’objectif est de répondre à une tâche particulière à travers de courtes conversations pour récupérer, auprès de l’utilisateur,  les informations nécessaires au traitement de celle-ci. Ces agents conversationnels sont de plus en plus courants et trouvent de nombreuses applications commerciales notamment en banque (Orange bank), en transport (SNCF), ou plus couramment sur les sites d’e-commerce.

Ces agents conversationnels adaptés à des tâches spécifiques ont effectivement de bonnes performances dans leurs applications. Ils permettent aux entreprises de concentrer leurs ressources internes sur des tâches à plus forte valeur ajoutée.

Ainsi, le défi des chatbots n’est pas tant de répondre à une tâche particulière mais plutôt de vraiment collaborer avec l’humain. Il s’agit de pouvoir traiter des conversations plus étendues et déstructurées, caractéristiques des interactions humaines. L’objectif est d’apprendre de la conversation en elle-même plutôt que d’une phrase ou d’un mot clef comme le ferait un agent pour une tâche spécifique.

Ces difficultés de collaboration sont particulièrement présentes pour les “assistants intelligents” car il est question de traiter un grand nombre de tâches simples pour lesquelles le contexte de la demande a une très grande importance. Un exemple basique de cette collaboration est celle de l’assistant Siri sur iPhone. Sur une première version de l’assistant personnel Siri en 2014, la question “Quels sont les restaurants près de moi” retournait bien les restaurants aux alentours mais l’assistant était ensuite incapable d’interpréter la question suivante “Est ce qu’un d‘eux est italien ?”. L’assistant était conçu pour des interactions uniques compte tenu de son vaste champ d’action.

Ce défi est critique dans la réussite commerciale d’une mise en application d’un chatbot. Construit selon la même logique, un chatbot en banque aura de fortes chances de succès alors qu’un chatbot en magasin aura beaucoup plus de difficultés à se faire adopter tant il est difficile de comprendre l’intention du client dans un environnement si étendu.

Pour résumer, les chatbots ont de bonnes performances pour traiter des situations simples et des tâches spécifiques mais ont plus de difficultés à collaborer avec l’utilisateur et vraiment comprendre la conversation dans son ensemble.  

Vouloir billet train ?

Les chatbots sont en directe interaction avec nous et vont de plus en plus rentrer dans nos vies quotidiennes. Il est alors légitime de s’interroger sur la façon dont ces agents virtuels vont changer notre façon de communiquer.

Comme constaté avec l’introduction des SMS puis des smileys, la technologie et notre environnement changent la façon dont nous communiquons et interagissons entre nous. Avec Google, nous avons appris à requêter de la manière la plus efficiente possible et nous recherchons maintenant en “mode mots clefs”, comme si notre raisonnement avait été façonné par le moteur de classement des résultats de Google. Les chatbots eux, s’intéressent aux intentions des utilisateurs. Ils se moquent de la politesse, des articles, de la conjugaison, et des pluriels. Nos enfants, en directe interaction avec eux, verront-ils leur langage évoluer par cet environnement.  Ainsi, les chatbots devront-ils s’adapter à nous, ou devrons-nous nous adapter à eux ?

Un chatbot ou des chatbots ?

La bataille des assistants virtuels est lancée. Google, Microsoft, Apple, Amazon sont sur le qui-vive pour proposer la meilleure expérience utilisateur possible (que ce soit par contrôle vocal ou textuel). Ce combat de titan mènera-t-il vers un unique chatbot capable de tout gérer dans notre vie quotidienne ? Les multiples agents virtuels spécifiques créés par des entreprises avant-gardistes seront-ils obsolètes ? L’état actuel du marché nous laisse imaginer un unique assistant sur lequel un “store d’agents” pourront venir se connecter pour répondre à des tâches spécifiques. C’est d’ores et déjà ce qui est proposé par le Google Assistant.

Qu’est ce qu’une voix standard ?

Les chatbots, à travers leurs multiples applications, posent de vraies questions éthiques. Ces agents virtuels interagissent directement avec l’humain et sont donc confrontés à sa langue ou son dialecte. Quand ils répondent de manière orale par synthèse vocale ils doivent même avoir une personnalité (homme ou femme, voix rauque ou aiguë, accent britannique ou américain) et même simuler des émotions.

Bien sûr ces agents ne peuvent pas avoir une infinité de voix ni même maîtriser une infinité de langues. Comment donc choisir les voix “standards” et les langues “nécessaires” à inclure dans ces agents ? De plus, la logique des chatbots étant construite sur les données de conversation enregistrées aux Etats-Unis, en Europe ou en Chine, qu’en est-il de l’inclusion du reste du monde ?

Nous pouvons donc nous interroger sur la nécessité de mettre en place une autorité indépendante pour évaluer l’inclusion des différentes ethnies et s’assurer que chacune soit représentée.

Que représente un chatbot pour nous ?

Enfin, chaque culture a sa propre représentation d’un agent virtuel : nous pouvons le voir comme un aimable serviteur, un gourou, ou encore un espion. Cela influence la façon dont nous interagissons avec lui et donc sa performance et son adoption par le grand public. Ces diverses représentations dans les différents pays et relatives à chacun rendent l’internationalisation d’une solution de chatbot difficile.

Conclusion

Le grand public a déjà de fortes attentes à l’égard des capacités des chatbots. La recherche et les différentes applications commerciales rendent ces agents de plus en plus performants et tendent peu à peu à relever le défi d’une collaboration réussie avec les humains. Cependant, ces nouveaux agents virtuels lancent une réflexion sur l’éthique et l’inclusion que nous devons mener pour garantir une #AIforgood. Qui sera donc à même de porter cette réflexion ? Est-ce un chantier pour l’initiative France is AI ?