Semiolex : un jeu sur l’origine des mots

Devinez les mots, éclairez les algorithmes.

Les grands modèles de langage comme ChatGPT sont performants, mais leur fonctionnement reste difficile à expliquer. Au LIUM (Laboratoire d’Informatique de l’Université du Mans), nous développons des alternatives aux outils comme ChatGPT qui sont conçues pour être interprétables par tous.

Pour mieux comprendre comment les utilisateurs interprètent nos outils, nous avons créé Semiolex, un jeu participatif. En jouant à deviner des mots, les utilisateurs interprètent les résultats de nos algorithmes, les thèmes. Ce projet mêle ainsi informatique, linguistique et sciences cognitives, en explorant comment nos connaissances de la langue guident notre interprétation de résultats informatiques.

Les coulisses des relations entre les mots 📃

Dans un texte, les mots n’apparaissent pas arbitrairement les uns à côté des autres. Le verbe ‘manger’ est souvent suivi de mots désignant de la nourriture. Ainsi, l’entourage d’un mot dans une phrase, que nous appelons contexte, détermine son sens. L’observation statistique des contextes des mots dans un corpus de textes permet aux ordinateurs d’approximer leur sens. Deux mots employés dans des contextes similaires sont plus proches que des mots ne partageant pas de contexte : c’est l’hypothèse distributionnelle.

Laisser un commentaire