Éclaircissement : le machine learning
Le machine learning est l’une des techniques majeures de l’intelligence artificielle contemporaine. Mais c’est quoi, au juste ?
∎ Il est souvent question de machine learning dans cette newsletter. Avec une touche de présomption, nous avons publié nos trois premières éditions sans nous poser une question essentielle : « Nos lecteurs savent-ils de quoi il s’agit ? » Dans un souci de vulgarisation, permettez-nous de vous expliquer.
Le terme « machine learning » ou « apprentissage automatique » désigne les algorithmes qui apprennent sans supervision humaine explicite : ces « machines » ne sont pas programmées pour accomplir une tâche, elles se forment seules à accomplir la tâche en question. Cela signifie que ces formules tirent un enseignement des données auxquelles elles sont exposées. Selon le concepteur de matériel informatique Nvidia, cet enseignement leur permet de formuler « une détermination ou une prédiction au sujet de quelque chose dans le monde. »
Pour éclaircir tout ceci, prenons un exemple souverain dans le domaine du machine learning : la chasse aux spams. Comment empêcher ces messages tantôt inutiles, tantôt malveillants de venir polluer votre boîte mail ? Un développeur pourrait écrire un programme qui les identifie en suivant un certain nombre de directives explicites : « Si le message provient de cette adresse ou s’il contient cette tournure de phrase, envoie-le dans la corbeille. »
Dans l‘apprentissage automatique, pas besoin d’humain pour inscrire les termes d’une mission dans la cervelle de la machine. D’abord, l’algorithme « observe » une base de données constituée de messages préalablement marqués comme « spam » ou « non-spam ». Puis, de ses observations, il déduit ce qui différencie un mail normal d’un mail fâcheux. Cette déduction lui permet de classer chaque nouveau mail qui lui est présenté comme « spam » ou « non-spam ».
L’exemple que nous venons de vous donner décrit un genre particulier de machine learning : l’apprentissage supervisé. Dans ce cas de figure, la base de données sur laquelle l’algorithme fait ses dents est préalablement marquée ou « labellisée ». Cela fonctionne pour « spam » ou « non-spam » et pour beaucoup d’autres choses encore : cette image montre-t-elle un chat ou un semi-remorque ? Cette critique dithyrambique d’une glacière connectée a-t-elle été écrite par un humain ou un robot ? Et ainsi de suite.
Seul dans le grand bain
∎ Il existe beaucoup d’autres genres de machine learning. Dans l’apprentissage non-supervisé, l’algorithme est lancé sur une base de données complètement dépourvue de marquage. Au fil de son périple parmi ces valeurs apparemment hétérogènes, il va dégager des tendances, des similarités… Ou plus généralement du « sens » dans la data.
Exemple : dans notre première édition, l’artiste Mario Klingemann évoque un algorithme qui parcourt une archive photographique pour en dégager des groupes d’images qui lui apparaissent similaires. Selon toute vraisemblance, il s’agit d’un algorithme d’apprentissage non-supervisé :
…La machine « voit » parfois des tendances qui m’échappent complètement dans ces datasets de plusieurs dizaines de milliers d’images. Ça pourrait même être un jeu : elle identifie des photographies qui lui semblent avoir quelque chose en commun, je regarde, je me demande ce que c’est… Et, oh ! Ce sont des gens qui regardent leur portable, par exemple.
Cet exemple montre bien la grande force des algorithmes d’apprentissage non-supervisé : contrairement aux humains, ces créatures paresseuses et faiblement dotées en mémoire vive, ils peuvent tirer rapidement du sens de gigantesques quantités de données. En ces temps de prolifération de l’information, ils sont donc une bénédiction pour les data miners qui cherchent à identifier des groupes dans les fichiers clients d’une multinationale, par exemple.
Sucres et jeu de go
∎ La troisième forme basique du machine learning est l’apprentissage par renforcement. Pour le laboratoire d’intelligence artificielle de l’université polytechnique et économique de Budapest, le « reinforcement learning » peut être comparé au dressage d’un chien : « Si votre chien accomplit la pirouette que vous désirez, vous le récompensez avec une friandise. Sinon, vous le punissez en ne le récompensant pas, ou en lui donnant un citron. Les chiens détestent vraiment les citrons. » C’est clair, non ?
Dans l’apprentissage par renforcement, un algorithme apprend à accomplir une tâche de façon optimale en recevant une récompense ou une punition chaque fois qu’il agit sur son environnement. Les humains interviennent seulement pour fixer les termes de la récompense et de la punition : ensuite, la machine se forme seule, dans la solitude et la douleur… Un peu comme un humain tout au long de sa vie. (Merci de ne pas vous abandonner à l’anthropomorphisme. C’est une machine. Elle ne sent rien.)
Permettez-nous de vous fournir un exemple d’apprentissage par renforcement plus adapté au contexte. Le programme AlphaGo Zero, le descendant du logiciel bien connu pour avoir soulevé le champion du monde de go, a perfectionné sa connaissance de ce jeu de société complexe en jouant des parties contre lui-même. Chaque défaite comptait comme une punition, et chaque victoire comme une récompense – évidemment.
Ainsi bouclons-nous notre succincte explication de ce qu’est le machine learning. Cependant, ne baissez pas votre garde : comme nous l’avons déjà dit, l’apprentissage informatique revêt beaucoup d’autres formes extrêmement raffinées, et nous nous sommes bien gardés de nous lancer dans des explications sur les rouages de ces fameux algorithmes. Force est de reconnaître que c’est un poil vaste et compliqué. ∎
Boîte Noire est la newsletter hebdomadaire sur l’intelligence artificielle de Sébastien Wesolowski. Inscrivez-vous par ici : http://eepurl.com/hivYvT