Aller au contenu
Informatique et communication Mathématiques - informatique - robotique

Objectifs

En jouant, les participants créent des annotations sur des corpus de textes. Ces annotations seront ensuite utilisées pour entraîner des outils de Traitement Automatique des Langues.

Actions concrètes

Les joueurs, après une courte formation, doivent identifier des relations grammaticales dans des phrases issues de textes libres de droits.

Terminé

Type de projet : En ligne

Période de participation : Toute l’année

Découvrez

Description du projet

Dans le domaine du Traitement Automatique des Langues, il est essentiel de disposer de ressources linguistiques comme des corpus de textes auxquels sont ajoutées des annotations linguistiques. La production de ces ressources est coûteuse. Une alternative est l’utilisation de jeu avec un but (GWAP : Game With A Purpose). L’idée est de proposer à des locuteurs un jeu de façon à ce qu’ils produisent les données attendues en jouant. Les deux principales difficultés de cette approche sont d’assurer, d’une part, que le jeu est abordable et, d’autre part que la ressource produite est linguistiquement pertinente.

Les témoignages des participants 

J’ai fait connaissance avec ZombiLingo, l’ancêtre de ZombiLudik, il y a deux ans. A cette époque, je venais de terminer ma thèse de doctorat en linguistique. Déstressant un peu, j’en profitais pour me changer les idées en assistant à des séminaires près de chez moi, dont une journée d’études organisée à l’Université catholique de Louvain-la-Neuve, en Belgique. Parmi les conférenciers invités se trouvait Karën Fort, qui venait présenter ses recherches portant sur les « jeux sérieux » ou « jeux pour la science », un domaine complètement inconnu pour moi. Malgré ma très faible expérience des « jeux vidéos » ou tout autre jeu sur Internet, j’ai tout de suite été attiré par le concept, et d’un naturel curieux je n’ai pas mis bien longtemps à explorer la plateforme de ZombiLingo. Au début, j’ai dû faire abstraction de mes intuitions de linguiste, mais petit à petit je me suis laissé prendre au jeu. La possibilité de monter de niveau, de défier d’autres joueurs en duel, m’a stimulé au point de vouloir jouer un maximum de phrases. Ce faisant, j’ai accumulé toute une série de trophées symboliques, m’établissant une certaine fierté comme joueur. Finalement, étant chercheur moi-même, le fait qu’en jouant j’aidais d’autres chercheurs donnait un sens supplémentaire à mon envie de jouer et de rejouer. Je me réjouis donc de voir ZombiLingo se transformer en ZombiLUDik. J’ai hâte d’explorer ce nouveau jeu et d’établir de nouveaux records…

Wellington

Les ressources langagières sont au cœur du Traitement Automatique des Langues (TAL) : les lexiques et les grammaires constituent le fondement des systèmes symboliques, alors que les corpus annotés permettent le développement de systèmes par apprentissage. Or, la production de ces ressources, quelles qu’elles soient, est extrêmement coûteuse. Une solution à ce problème majeur est d’utiliser le crowdsourcing (la production participative), par le biais de Jeux ayant un but (GWAP : Games With A Purpose). Les participants, en jouant, produisent des données annotées. Outre la nécessité de créer un jeu véritablement attrayant sur le long terme et celle d’en faire la publicité, cette approche impose des méthodes d’évaluation nouvelles, afin de s’assurer que la ressource produite est linguistiquement pertinente.

Voir : hal.inria.fr/hal-01378980

La participation

Formation nécessaire

Oui, la formation est comprise dans le jeu

Matériel nécessaire

Ordinateur

Les co-responsables

Karën Fort

Karën Fort

Maîtresse de conférences

Sorbonne Université

STIH

Karën Fort

Les partenaires