Les recherches autour de l’intelligence artificielle prêtent parfois à sourire : manger une table ? Manger son chapeau, éventuellement, tout en gardant l’image métaphorique à l’esprit… Mais les robots ont cette habitude assez soupe au lait que de prendre au pied de la lettre ce qu’on leur fait rentrer dans les octets. Des chercheurs tentent alors une autre approche, plutôt pédagogique…
aujourd’hui, tout être humain sait, même assez rapidement quels sont les verbes qu’il peut associer au terme “téléphone” : brancher, saisir, passer, allumer, casser et ainsi de suite.
En revanche, certains sont totalement incompatibles, parce que le sens qui s’en dégage devient incompréhensible — ou poétique, faut voir. Mais dans tous les cas, “nager un téléphone” ou “danser un téléphone” semblent des actions particulièrement saugrenues. Entre le monde de l’humain et celui du robot, se trouve donc la quête du sens — l’apprentissage sémantique demeurant celui qui nous permettra de converser, de prendre place au sein d’une société, etc.
D’abord, s’entendre sur les termes...
En somme, le vocabulaire, son usage, sa compréhension sont à la base de toute forme d’interaction d’abord avec les objets qui nous entourent, ensuite avec les personnes.
Pour bien faire rentrer cela dans une tête de robot, plusieurs chercheurs de l’université de Brgham Young ont décidé de travailler avec un outil assez peu conventionnel : l’encyclopédie Wikipedia. Premier avantage : elle est déjà numérique. L’apprentissage par la machine s’en trouve donc nécessairement simplifié. Mais là n’est pas l’enjeu majeur. (...)
Or, danser un téléphone, manger une table : pour un robot, dans l’absolu, cela ne pose aucun problème… Si l’on souhaite se servir plus efficacement des machines, et qu’elles peuvent un jour nous rendre service, il importe tout de même de résoudre cela. (...)
Les appareillages possibles entre verbe et objet pourraient être simplifiés de par le recours à l’encyclopédie en ligne.
Pour tester leur projet, voici donc que la machine s’est retrouvée devant des suggestions avec des morceaux phrases à mettre en relation, suivant une cohérence syntagmatique — de fond et de forme. Et la méthode Wikipedia a réellement prouvé son efficacicité permettant plus de 75 % de réussite. (...)
Les applications sont encore lointaines, comme toujours, mais la science continue d’avancer dans le monde du machine learning. Bien des nuances restent à apporter : par exemple, demander à un robot « prends mes lunettes », recèle un certain nombre d’actions possibles, que la machine est pour l’heure incapable de contextualiser. Faut-il soulever, transporter, donner, lesdites lunettes ? Cette autre nécessité de compréhension viendra dans un prochain temps.
Quant à tuer le temps, les lois de la robotique d’Asimov s’y opposeront peut-être… à moins que cela ne puisse sauver un humain ?