Alignement du vocabulaire OLAC des jeux vidéo avec Wikidata

Cet article est une traduction libre de l’article Linking the OLAC Video Game Vocabulary with Wikidata, écrit par Tracy Hoffmann (diggr Team) et Peter Chan (Stanford University Libraries), et publié le 29 janvier 2019 sous licence CC BY 4.0.


Wikidata est une base de connaissances collaborative sous licence libre que chacun peut modifier. Depuis sa création en 2012, c’est devenu une base de connaissances et une infrastructure largement utilisées. Dans ce billet, nous décrivons pourquoi et comment nous importons le vocabulaire OLAC des jeux vidéo dans Wikidata.

Motivation

L’OLAC Inc. (Online Audiovisual Catalogers, catalogueurs en ligne de l’audiovisuel) est une organisation américaine pour les catalogueurs intéressés par tout type de documents non imprimés. Elle a présenté l’OLAC Video Game Genre Vocabulary (vocabulaire OLAC des genres du jeu vidéo) en 2018 pour aider au catalogage des jeux vidéo. Le groupe de travail CAMMS/SAC/GFIS/Video game de l’OLAC a fait des recherches sur plus de 200 termes de genres du jeu vidéo dont l’inclusion dans le vocabulaire final a été envisagée. La liste des 66 termes approuvés dans le vocabulaire OLAC des genres du jeu vidéo, leurs recommandations d’utilisation, ainsi que les entrées MARC correspondantes pour ces termes peuvent être trouvées sur le site web de l’OLAC, dans la catégorie Cataloging Resources : OLAC video game genre vocabulary. Cet ensemble de vocabulaire maîtrisé pour le jeu vidéo est soutenu par la bibliothèque du Congrès et devrait être utilisé par tous les catalogueurs des bibliothèques aux États-Unis. En l’ajoutant dans Wikidata, nous allons le mettre en visibilité d’une plus large audience, et également faciliterons le maillage des jeux vidéo.

Première partie : proposition de la propriété dans Wikidata

Pour lier les termes du vocabulaire avec les items Wikidata existants, il nous fallait une propriété définie comme identifiant externe. Les propriétés sont proposées et discutées dans une rubrique spécifique. Un modèle avec des informations sur le vocabulaire et quelques exemples a dû être renseigné. Ensuite, nous avons attendu avec curiosité les retours de la communauté, dans le but d’aboutir à un consensus. Après 7 jours, la proposition de la propriété avait 8 soutiens. C’était donc un résultat clair qui a abouti à la création de la propriété vocabulaire OLAC du jeu vidéo (P6352).

Deuxième partie : import et alignement

Le vocabulaire OLAC des genres du jeu vidéo est disponible dans l’Open Metadata Registry. Après téléchargement, puis nettoyage et préparation des données avec Open Refine, les données ont été transformées au format CSV requis pour l’import. Ainsi, on a :

Avec ceci, un catalogue Mix’n’match a été créé. « Mix’n’match peut lister les entrées de bases de données externes et permet aux utilisateurs de les relier à des items Wikidata » (source). Après un import réussi, les données ont pu être alignées via l’interface du navigateur. Dans le cas où il n’y avait aucun candidat possible, de nouveaux items Wikidata ont été créés.

L’alignement des 66 termes a été rapide mais, comme l’alignement d’un vocabulaire est rarement sans ambiguïté, il y a encore beaucoup de choses à améliorer. Certains problèmes ont déjà été identifiés et sont discutés au sein de la communauté Wikidata.

Appel à participation

Il y a des groupes thématiques dans Wikidata. L’un d’eux est le groupe de travail sur les jeux vidéo. Ce wiki-projet est le lieu pour entrer en contact avec la communauté du jeu vidéo dans Wikidata. Dans les pages de discussions, des questions, des propositions ou des sources peuvent être publiées. Jusqu’à présent, beaucoup de choses ont été accompli par quelques contributeurs très ambitieux de ce groupe : plus de 50 identifiants externes pour les jeux et 10 pour les matériels et les logiciels liés au jeu vidéo ont été créés, reliant de nombreuses bases de données spécialisées. Mais il reste encore beaucoup à faire. Par exemple, d’autres catalogues Mix’n’match attendent encore d’être alignés.

Wikidata est une ressource formidable pour les informations sur les jeux vidéo, en particulier de manière grandissante pour la recherche sur les jeux vidéo car de plus en plus de données y sont agrégées et modélisées. La participation active de la communauté scientifique est très appréciée et aidera à rendre Wikidata encore plus utile pour les chercheurs.

Si vous avez des idées de donation de données ou d’alignement avec d’autres bases de données externes, n’hésitez pas à nous contacter ou à entrer directement en contact avec la communauté Wikidata.

Cet autre article sur les jeux vidéo dans Wikidata pourrait vous intéresser : Wikidata and the sum of all video games − 2018 edition (la traduction en français est disponible ici : Wikidata et la somme de tous les jeux vidéo — Édition 2018).