ArchAIDE : Restes archéologiques et intelligence artificielle

Boîte noire
10 min readJan 18, 2021

--

L’application ArchAIDE simplifie le travail des archéologues en identifiant pour eux des fragments de poterie et de céramique. Rencontre avec ses courageux parents, Gabriele Gattaglia et Francesca Anichini.

ArchAIDE en utilisation. Image : ArchAIDE Project

Tous les métiers ont leurs moments d’excitation et d’ennui. Pour les archéologues, ces moments d’ennui prennent souvent la forme de longues recherches : tout reste historique excavé ne signifie rien sans identification, et cette identification demande souvent de feuilleter des catalogues pendant des heures. Le projet ArchAIDE entend changer cela.

ArchAIDE est une application mobile qui utilise deux réseaux de neurones pour identifier automatiquement l’origine des fragments de poteries et de céramiques qui lui sont présentés. Ce petit bout de terre cuite vient-il d’une amphore romaine ? D’une majolique archaïque ? Une simple photographie permet au système de produire en quelques secondes une réponse que des archéologues auraient peut-être mis des heures à obtenir.

Les archéologues italiens Gabriele Gattiglia et Francesca Anichini ont créé ArchAIDE en 2016. En quelques années, leur projet a pris une ampleur internationale : de nombreux établissements européens et une université israélienne leur ont prêté main forte. Étant donné l’ampleur et la complexité de la tâche, cette aide n’était pas de trop. Boîte Noire rencontre ces deux courageux qui entendent bien changer leur discipline.

∎ Pouvez-vous vous présenter ?

Gabriele Gattiglia : Je suis professeur d’archéologie médiévale et post-médiévale à l’université de Pise. Depuis quelques années, je travaille surtout dans le domaine de l’archéologie numérique, notamment sur les systèmes GIS et les bases de données. En 2012, nous avons commencé à collaborer avec des mathématiciens au sein du Mappa Project, qui utilisait des algorithmes pour prédire le potentiel archéologique d’une zone géographique. Quatre ans plus tard, nous nous sommes lancés dans l’intelligence artificielle avec ce projet, ArchAIDE. Cela fait cinq ans que l’essentiel de mes activités sont liées à ces questions.

Francesca Anichini : Je suis archéologue et je travaille pour l’université de Pise depuis 2010. Actuellement, je travaille au sein de son unité de recherche, le laboratoire MAPPA. Je travaille particulièrement sur des aspects méthodologiques de l’archéologie contemporaine et sur ses applications numériques. Je gère les projets et leur communication, surtout.

∎ Qu’est-ce qu’ArchAIDE ?

GG : ArchAIDE est un système de reconnaissance automatique de la poterie par intelligence artificielle. L’idée nous est venue quand nous étions encore archéologues professionnels. Sur le terrain, on manque de temps et l’analyse des poteries est longue et difficile. ArchAIDE facilite tout ça. Première utilisation possible : vous trouvez un fragment de poterie qui comporte des décorations, des couleurs, des dessins… Vous le prenez en photo et le faites parvenir au classifieur avec une application mobile. Le classifieur observe l’apparence du fragment et vous fournit cinq réponses avec un pourcentage de précision pour chacune.

Deuxième utilisation possible : vous trouvez un fragment non-décoré que vous allez devoir identifier par la forme, ce que font généralement les archéologues. Vous prenez une photo mais cette fois, vous tracez également les contours du fragment dans l’application. Ensuite, vous envoyez le tout au classifieur qui vous donne cinq réponses avec le degré de précision estimé. Dans cette utilisation comme dans la première, vous pouvez alors consulter chaque réponse et explorer toutes les informations disponibles pour elle dans la base de données de référence.

FA : Les cinq réponses proviennent de catalogues scientifiques que la communauté archéologique reconnaît comme des ressources valides pour chaque genre de céramique. Ce que vous voyez sur votre écran provient de ces ouvrages. C’est comme avoir tous ces catalogues dans votre smartphone, ce qui est bien pratique car les archéologues voyagent souvent avec des montagnes de livres vraiment lourds… Ainsi, si vous connaissez déjà le genre de votre fragment, vous pouvez utiliser la base de données comme un catalogue.

∎ Quels problèmes ArchAIDE permet-il de résoudre ?

FA : En général, quand un archéologue veut identifier un fragment de céramique, il feuillette des centaines de pages pour trouver les dessins correspondants. Cela prend énormément de temps. C’est même une activité spécialisée, car il existe tant de genres de céramique différents que personne ne peut les connaître tous. Avec ArchAIDE, nous essayons de combler ce besoin sans trop nous éloigner des méthodes traditionnelles, car notre communauté est plutôt têtue. [Rires] Notre outil propose ses réponses en quelques secondes mais laisse le dernier mot au spécialiste. Quand il pourra être utilisé partout parce qu’il connaîtra suffisamment de genres de poterie, ArchAIDE pourrait aussi devenir un bon moyen de partager son savoir sans trop perdre de temps.

GG : ArchAIDE permet de déplacer une partie du travail archéologique. Plutôt que de reconnaître des fragments, une tâche basique et coûteuse en temps, vous pouvez vous investir dans l’analyse de leur signification.

FA : En fait, l’étude de la céramique comporte deux niveaux. Le premier consiste en une reconnaissance générale des objets. Le but est de dégager une date et une classe, ce qui permet de découvrir où et quand vous vous trouvez dans une excavation. ArchAIDE a été conçu pour gérer ce premier niveau. Il est impossible pour chaque archéologue de tout savoir de la préhistoire aux temps contemporains. Mais quand vous êtes sur le terrain et que vous creusez, il est important de découvrir au moins ces quelques informations fondamentales. Le deuxième niveau d’étude est l’analyse vraiment détaillée de chaque fragment. Notre outil laisse ça aux humains.

∎ Combien de genres de poteries ArchAIDE peut-il identifier aujourd’hui ?

GG : Cinq. Notre base de données comporte des informations au sujet des amphores romaines, des céramiques sigillées d’Italie, de Gaule du Sud et d’Espagne, et des majoliques de Monteluppo, Barcelone et Valence. Le classifieur fonctionne avec les trois genres de céramiques sigillées et avec les majoliques de Monteluppo. Ces derniers mois, nous avons ajouté un nouveau genre de majolique dite « archaïque » que l’on trouve du côté de Pise. Nous avons également commencé à travailler sur des poteries de l’âge de bronze et sur des céramiques communes de Rome. En parallèle, nous développons des réseaux de neurones pour des archéologues sud-américains.

FA : Nous souhaitons que l’ajout de nouvelles informations puisse se faire de façon collaborative, notamment en permettant à la communauté de verser leurs propres découvertes à la base de données. Nous avons reçu des réponses enthousiastes de nombreux collègues du monde entier, et pas seulement pour la céramique ou la période romaine. Je crois que nous pouvons espérer agrandir le système.

∎ J’ai lu quelque part que vous aviez eu beaucoup de mal à réunir toutes les données nécessaires pour entraîner votre intelligence artificielle…

GG : En fait, ArchAIDE repose sur deux réseaux de neurones distincts : un pour les décorations, un autre pour la forme. Celui qui concerne les décorations a été le plus facile à monter parce que nous disposions de plus de données : environ 15 000 images de décorations au total. Pour un archéologue, c’est énorme ! Mais pour une intelligence artificielle, ce n’est pas grand-chose. Nous avons donc utilisé l’augmentation pour « multiplier » ces images douze fois, ce qui nous a permis de récupérer plus de 150 000 exemples pour entraîner le réseau. Cette étape était relativement aisée, notamment parce que nous avions choisi de travailler avec une classe de poterie qui était produite aux alentours de Pise et en Toscane en général. Comme nous avons accès aux entrepôts des musées qui collectionnent ce genre de poterie, les images ont été faciles à collecter.

Par contre, les fragments nous ont posé un gros problème. Au début du projet, nous pensions que dix images de chaque genre de poterie suffiraient à entraîner le modèle… Ça n’a pas marché. Nous avons dû voyager dans toute l’Europe pour visiter des entrepôts, ce qui nous a permis de récupérer 3 500 images au total. Cela ne suffisait pas du tout pour entraîner notre réseau de neurones, d’autant que dans ce cas de figure, nous ne pouvions pas utiliser de modèle pré-entraîné.

∎ C’est le moment où vous avez décidé de créer des « poteries synthétiques d’entraînement ».

GG : Absolument. Nous avons créé des poteries en 3D que nous avons brisées virtuellement pour obtenir de quoi entraîner notre algorithme. Malheureusement, cela a posé un autre problème, car les quantités phénoménales de données dont nous disposions désormais étaient trop difficiles à analyser pour nos ordinateurs. Nous avons donc décidé de n’utiliser que des représentations en deux dimensions de nos débris synthétiques. Ensuite, nous avons donné un peu plus de variété à nos exemples en jouant avec les paramètres des poteries virtuelles. L’épaisseur, par exemple, pour simuler les irrégularités d’une céramique humaine.

À force de petites astuces de ce genre, nous sommes parvenus à entraîner notre réseau. Les 3 500 images de fragments authentiques que nous avions rassemblées au début ont finalement servi de données de test. Cela nous a permis de peaufiner nos résultats… Comme vous pouvez l’imaginer, l’algorithme était plus que capable d’identifier des fragments synthétiques, mais les vrais fragments lui donnaient plus de mal. [Rires]

Finalement, nous avons atteint un stade où les cinq propositions de la machine contenaient la bonne réponse dans 60% des cas dans la reconnaissance des formes, et dans 80% des cas dans la reconnaissance des décorations. ArchAIDE reconnaît un large pourcentage des poteries les plus communes dans les excavations archéologiques mais aussi, avec un degré de précision moindre, des genres de poteries plus inhabituels. Bien sûr, si vous trouvez un fragment bizarre qui provient du service à thé personnel de la reine Élisabeth II, il va avoir un peu plus de mal… Mais un archéologue aussi.

∎ Selon quels exemples les modèles synthétiques ont-ils été dessinés ?

GG : Nous avons utilisé les dessins des catalogues, dont nous avons automatiquement extrait les informations à l’aide d’un programme conçu par nos collègues du Conseil national de la recherche. Vous mettez le dessin dans le programme, il vous sort les lignes internes et externes du profil.

FA : En archéologie, chaque genre de poterie a un dessin avec un profil, un genre de section. Ce sont ces dessins qui se trouvent dans les catalogues scientifiques.

GA : C’est un petit jeu assez simple. Quand vous disposez d’un profil, vous pouvez reconstruire le vase en faisant tourner ce profil autour d’un axe vertical. Ainsi, vous recréez automatiquement les contours du vase… Mais pas poignées, que vous devez vous-même mettre au bon endroit. Cette étape a été réalisée de façon semi-automatique.

FA : Tous les modèles 3D que nous avons créés de cette façon ont été publiés par l’archive Archeology Data Service de l’université de York. Ils sont open source, vous pouvez les télécharger, les imprimer en 3D pour faire des jouets… Tout ce que vous voulez.

∎ Au fait, pourquoi la poterie et pas un autre genre d’artefact ?

GG : Parce que la poterie est le genre le plus répandu d’artefact archéologique, particulièrement dans les temps historiques. Les excavations contiennent parfois des milliers et des milliers de fragments de poteries ! De plus, ces fragments contiennent énormément de renseignements sur la société, le commerce et la technologie de leur époque. Ceci dit, le système en soi pourrait fonctionner avec n’importe quel genre d’artefact. Nous n’avons pas encore essayé, mais il pourrait être utilisé sur des pièces, des ossements…

∎ ArchAIDE est-il le premier outil d’intelligence artificielle à l’usage des archéologues ?

GG : Non, l’archéologie utilise déjà diverses solutions d’intelligence artificielle. Une application permet déjà de combattre le problème du puzzle en reconstituant des céramiques à partir d’une simple photographie de fragment. D’autres outils sont capables de détecter, par le biais de drones aériens, la présence de restes archéologiques dans un champ. Mais aucun autre système n’est capable de reconnaître un seul fragment de poterie depuis une photographie. C’est la force d’ArchAIDE et ce qui le différencie des autres systèmes.

∎ En 2016, au début du projet, on vous sent enthousiastes dans vos publications. Deux ans plus tard, vos papiers semblaient beaucoup plus froids car les problèmes sont arrivés. Comment avez-vous vécu ce projet ? C’était intéressant, difficile, excitant ?

GG : Toutes ces choses à la fois. C’était cool et excitant, surtout pour nous, car c’est notre idée. Nous avons eu beaucoup de mal au milieu du projet, quand nous nous sommes demandés si nous allions vraiment pouvoir atteindre notre but. Mais ensuite, nous avons réussi. Quand j’ai utilisé l’application pour la première fois et qu’elle a été capable de reconnaître un fragment de poterie de Monteluppo, c’était magique. C’était comme un rêve.

FA : Quand nous avons commencé à penser à ce projet, il y a dix ans, nous en avons parlé avec des collègues du CNR, des scientifiques, qui nous ont dit : c’est impossible, utopique !

GG : Ça a aussi été difficile au début, quand nous avons commencé à collaborer avec l’équipe chargée de l’intelligence artificielle. Ce n’était pas une question personnelle mais scientifique : nous avions du mal à comprendre ce dont ils avaient besoin et ils avaient du mal à comprendre ce dont nous avions besoin. Nous avons beaucoup discuté. C’était parfois frustrant. Mais à la fin, l’un d’entre eux connaissait mieux les amphores romaines qu’un archéologue ! Il allait dans des musées pour voir des fragments de poterie, pour mieux comprendre les problèmes. De la même façon, en tant qu’archéologues, nous en savions d’abord très peu sur l’intelligence artificielle. Mais maintenant, nous pouvons parler de PointNet, des réseaux de neurones convolutifs…

∎ Vous faisiez partie du programme Horizon 2020 de l’UE. Où va ArchAIDE désormais ?

FA : Nous avons pu intégrer Horizon 2020 grâce à Maria Letizia Gualandi, notre collègue à l’université de Pise. Dans sa première forme, ArchAIDE s’est achevé en 2019. Maintenant, nous sommes à la recherche de financements et de collaborations autour du monde. En même temps, nous récupérons de nouvelles données Nous travaillons aussi à l’entraînement et au test du réseau avec des données différentes. Je crois que le projet peut porter une grande discussion concernant l’utilisation, les opportunités et le potentiel de l’intelligence artificielle dans l’archéologie.

Boîte Noire est la newsletter hebdomadaire sur l’intelligence artificielle de Sébastien Wesolowski. Inscrivez-vous par ici : http://eepurl.com/hivYvT

--

--

Boîte noire
Boîte noire

Written by Boîte noire

Boîte Noire est une newsletter hebdomadaire sur l’intelligence artificielle. Inscrivez-vous par ici : http://eepurl.com/hivYvT

No responses yet