Des conférences passionnantes
Depuis quelques mois j’ai assisté à toute une série de séminaires, cours magistraux et réunions fermées avec de grands noms de l’intelligence artificielle et des domaines associés, sciences des données et réseaux de neurones ; j’ai déjà rendu compte de certains dans un article précédent ; il me semble opportun de vous les signaler et de vous donner les liens des textes et des vidéos leurs interventions, parce qu’à l’heure où les incompétents se bousculent pour énoncer leurs prophéties apocalyptiques sur ce qu’ils croient être l’état de la science sur le sujet, il n’est pas superflu d’entendre les véritables chercheurs de ces domaines.
Tous ces conférenciers nous ont exposé des résultats remarquables obtenus par les méthodes et les logiciels dits d’intelligence artificielle. Mais ils ont tenu également à nous avertir que ces résultats avaient beaucoup moins à voir avec ce que l’on pourrait appeler l’intelligence qu’avec, plutôt, les méthodes de classification statistique. Pour reprendre un aphorisme de Judea Pearl (Turing Award 2011) : “All the impressive achievements of deep learning amount to just curve fitting”. Plus précisément, dans un logiciel d’IA, il y a bien de l’intelligence, celle des auteurs du logiciel, qui, au moment où on l’utilise, se manifeste comme de l’intelligence accumulée préalablement, qui va aider l’intelligence immédiate de l’être humain qui est derrière l’ordinateur. C’est le travail du cerveau humain, aidé par l’automate programmable universel et ubiquitaire qu’est l’ordinateur connecté à l’Internet, qui produit un résultat que l’on peut qualifier d’intelligent.
Alexandre Anzala-Yamajako attire cependant mon attention sur une spécificité des programmes d’IA, qui leur confère des capacités supplémentaires : « contrairement aux méthodes de programmation “classiques”, l’intelligence artificielle permet aux utilisateurs, en plus de simplement interagir, de modifier le comportement du programme, et ce hors du contrôle du programmeur (qui ne pourra souvent même pas “corriger le tir”). J’aime bien l’exemple de Microsoft et de son robot twitter. » Soit-dit en passant, le fonctionnement de ce robot me semble très représentatif de la non-intelligence de l’IA : répéter comme un perroquet, mais de façon astucieuse (enfin, pas tant que cela). En l’occurrence, il avait suffi que des internautes bien organisés submergent le robot de tweets racistes pour lui faire apprendre le racisme, qu’il proclamait ensuite à tort et à travers ; Microsoft n’a eu d’autre recours que de l’arrêter.
L’ordinateur peut-il mentir ?
Ainsi, la réponse à la question « l’ordinateur peut-il mentir ? », au cœur de l’intrigue de maint roman de science-fiction, n’a rigoureusement aucun sens : d’abord l’ordinateur ne dit rien, c’est le logiciel qui éventuellement donne une réponse à une question ; et si cette réponse est contre-factuelle, par exemple, c’est que l’auteur du logiciel l’a programmée ainsi, volontairement ou involontairement. Il y a quelques décennies existaient des langages de programmation dits « à liaison dynamique », c’est-à-dire que la valeur des variables des programmes écrits dans ces langages dépendait de façon assez imprévisible des itérations précédentes : ce comportement était censé mimer le charmant indéterminisme de la pensée humaine, en quelque sorte l’imagination. On s’est vite rendu compte que c’était surtout source d’erreurs, et on est revenu à la liaison lexicale, qui permet d’écrire des programmes justes, ce qui n’est déjà pas si mal.
Application à la cyberdéfense
Il y a beaucoup de domaines où les logiciels d’apprentissage et de diagnostic donnent d’excellents résultats : reconnaissance de formes, de motifs récurrents, diagnostic, et ils sont utilisés avec succès pour des applications médicales, de reconnaissance de la parole, de spéculation boursière, de pilotage automatique de véhicules, etc.
J’imagine bien une application à la cyberdéfense : lorsque l’on subit une cyberattaque, il est difficile d’en identifier l’origine, parce que dans le cyberespace il existe mille moyens de dissimuler l’adresse des ordinateurs qui l’ont déclenchée.
En l’absence d’un algorithme direct pour déterminer les adresses d’émission des charges nuisibles, il faut se rabattre sur des heuristiques, et c’est là que les systèmes de réseaux de neurones formels excellent. L’apprentissage à partir d’une base de données des attaques passées et de leurs caractéristiques semble une piste prometteuse. Je tiens de Kavé Salamatian l’idée que le style de programmation des auteurs du logiciel malfaisant peut être analysé à partir du binaire, et attribué à telle ou telle école nationale : ainsi, les universités soviétiques ont souvent enseigné la programmation en style fonctionnel, qu’ils ont transmis à l’école israélienne par émigration des programmeurs. Un logiciel de style fonctionnel sous forme binaire peut être identifié. On en revient aux “cribs” des cryptanalystes de Bletchley Park pendant la guerre !
Ce que l’IA ne peut pas
Nos chercheurs ont tous attiré notre attention sur ce que l’IA ne pourrait jamais : accéder au sens d’un événement ou d’un énoncé, parce que pour un logiciel rien n’a de sens, c’est pour des humains que des choses, des expériences ou des discours ont un sens. Une autre chose qui nous est possible grâce à la structure récursive de notre langage [1] : donner un sens à un énoncé que nous n’avons jamais entendu avant, parce que l’acquisition des structures du langage nous permet non seulement de reconnaître des énoncés entendus auparavant, ce que l’IA arrive très bien à faire, mais aussi d’attribuer un sens à quelque chose de complètement inédit. Pour emprunter un exemple fameux à Gottlob Frege, il fut un temps où la locution « cygne noir » était un oxymore, mais l’exploration de l’Australie a invalidé cette proposition logique d’une façon qu’aucun logiciel n’aurait pu calculer.
La structure des énoncés du langage et leur sens sont inaccessibles à l’IA : cela résulte aussi de ce qu’ils sont infléchis par l’influence du contexte dans lequel ils se donnent, or le contexte est indéfini, et infini, ce sont même ses caractéristiques principales. Indéfini, parce qu’il est propre à chaque individu, infini, parce qu’il se prolonge jusque dans notre inconscient et dans celui de nos ancêtres, ainsi que dans nos expériences sensorielles les plus intimes.
Voici le programme vidéo
Voici, pour vous donner une idée de l’effervescence autour de ces questions, la liste de mes visites, avec des références que je vous suggère de visiter, elles méritent toutes un détour :
– 11 janvier 2018 au Collège de France : leçon inaugurale de Stéphane Mallat, chaire de Sciences des données.
– 7 mars 2018 : séance de travail avec Sylvie Thiria, Fouad Badran et Michel Volle.
– 9 mars 2018 au Colloquium du LIP6 de la Sorbonne : Léon Bottou de Facebook AI Research, planches et vidéo de la conférence disponibles en ligne.
– 29 mars 2018 au Collège de France sous la présidence de Cédric Villani : AI for Humanity, avec Justine Cassell, Laurence Devillers, Noriko Araï, Cathy O’Neil, Yann Le Cun, Stéphane Mallat, Stuart Russel, Fei Fei Li, Grégory Renard et Marie-Paule Cani.
– 15 mai 2018 à l’Institut de l’Iconomie : Robert French, professeur de psychologie expérimentale à l’université de Dijon ; spécialiste de sciences cognitives, il a soutenu sa thèse à l’université du Michigan à Ann Arbor sous la direction de Douglas Hofstadter.
– 11 juin 2018, séminaire Inria Alumni avec Alexandre Gramfort (Inria), Guillaume Dumas (Institut Pasteur), David Ojeda (Mensia Technologies).
– 20 juin au Colloquium du LIP6 de la Sorbonne : Eric Horvitz, Microsoft, MSR Labs : AI Aspirations and Advances, conférence en ligne.
– 22 juin 2018, Gilles Dowek sur l’enseignement de l’IA, ou plutôt informatique : « on a des heures, des contenus, il manque juste des profs bien formés ».
Et par écrit :
– Julien Lemoine et Simon Viennot. Il n’est pas impossible de résoudre le jeu d’échecs. 1024, no 6 (2015).
– Serge Abiteboul et Tristan Cazenave. Go : une belle victoire... des informaticiens. 1024, no 8 (2016).