Bilan de Dicare
Dicare était un site web consacré aux députés de la Ve République française. Un de ses objectifs était de mettre en valeur les projets Wikimedia, en montrant qu’il est possible de réutiliser leurs contenus dans d’autres projets. Ainsi, les données structurées de Dicare provenaient de la base de connaissance Wikidata et les images de la médiathèque Wikimedia Commons.
Dicare
Le cœur de Dicare était l’historique des mandats de la députés de la Ve République (avec pour chacun : député, législature, circonscription électorale, dates de début et de fin). Avant 2016, les informations de Wikidata sur ce sujet étaient parcellaires. Depuis son ouverture en avril 2016, le site m’a permis de suivre mes contributions sur ce thème. À son terme, Dicare disposait de données sur plus de 2500 députés de la Ve République. Tous les mandats étaient renseignés pour la précédente et l’actuelle législatures (14e et 15e), ainsi que pour l’ensemble de la Ve République pour de nombreux départements (dont tous les départements bretons). En plus de cet historique, plusieurs sujets ont été explorés.
Le premier a été la longévité des députés à l’Assemblée nationale. Ainsi, on peut noter quelques records, à commencer par celui de Didier Julia, qui a passé plus de 44 ans sur les bancs de l’Assemblée. D’autres sont restés moins longtemps : une journée pour Catherine Pen, dans l’incapacité de remplacer la députée dont elle était suppléante ; quelques jours pour de nombreux suppléants, remplaçant des députés nommés au gouvernement juste avant les élections législatives ; etc.
Un deuxième sujet a été l’égalité femme-homme. Ce n’était évidemment pas une découverte, la parité n’a jamais existé à l’Assemblée nationale, même si elle s’améliore sensiblement depuis la 11e législature en 1997. Auparavant, il y avait toujours eu moins de 10 % de femmes à l’Assemblée nationale !
Un troisième sujet a été l’usage de Twitter par les députés. J’ai pris le temps, pour l’ensemble des députés des 14e et 15e législatures, de vérifier s’ils avaient un compte Twitter (et le cas échéant de le renseigner dans Wikidata). Voici, en février 2017, le nombre de députés avec un compte Twitter, en fonction de leur tranche d’âge :
Tranche d’âge | Nombre de députés | Avec un compte Twitter | Part |
---|---|---|---|
39 ans et moins | 17 | 17 | 100 % |
40 — 49 ans | 83 | 76 | 92 % |
50 — 59 ans | 181 | 158 | 87 % |
60 — 69 ans | 189 | 140 | 74 % |
70 ans et plus | 102 | 58 | 57 % |
Suite aux élections législatives de juin 2017, les chiffres se sont nettement tassés (pour chaque tranche d’âge, au moins 70 % des députés avaient un compte Twitter), probablement car la communication sur les réseaux sociaux faisait partie des stratégies de campagne de bon nombre de candidats.
Enfin, un bot Twitter souhaitait chaque jour l’anniversaire des députés avec un mandat en cours, ce qui a pu mener à quelques discussions amusantes, comme celle-ci.
Qualité des données
Les données de Wikidata étaient importées ponctuellement dans Dicare. Plusieurs méthodes m’ont permis de m’assurer de la qualité des données présentes dans Wikidata avant ou après leur import dans Dicare :
- lors de l’import, quelques données étaient filtrées (par exemple parce qu’elles n’avaient pas le format attendu ou la précision nécessaire) ;
- après l’import, le site web listait les députés ne respectant pas certaines règles (données manquantes comme une date de naissance non renseignée, ou données incohérentes comme le chevauchement dans le temps des mandats de deux députés dans la même circonscription) ;
- sans lien avec les imports, une page web de statistiques indique le nombre de députés ne respectant pas certaines règles, avec la possibilité de les lister. Le premier intérêt de cette page est que le contrôle se fait directement sur les données Wikidata (grâce au endpoint SPARQL), sans nécessiter d’import. Le second avantage est que l’affichage est optimisé pour le sujet (par exemple, les listes sont découpées par législature). C’est pour moi le meilleur moyen de contrôler la qualité des données de Wikidata sur ce sujet, plus puissant que les listes d’erreurs des contraintes Wikidata (limitées dans leurs possibilités) et plus ergonomique, avec une visualisation immédiate des problèmes et des liens vers les sources les plus communes sur le sujet.
À noter que le gadget checkConstraints de Wikidata est également excellent, mais utilisable sur un seul élément Wikidata à la fois (et avec toujours les limitations de l’expressivité des contraintes).
J’ai rapidement testé le moteur de règles JBoss Drools, mais il s’est avéré assez peu adapté dans mon cas : développement dans un second langage de programmation par rapport au site web, nécessité de répliquer le modèle de données, etc. L’usage du framework est plus approprié pour des problématiques plus complexes et avec une homogénéité dans les choix techniques.
Enfin, je n’ai pas encore eu le temps d’essayer ShEx.
Fin et suite
Le site a fermé en mars 2018. Toutefois, rien n’est perdu. Les données restent disponibles dans les projets Wikimedia : les données structurées dans Wikidata et les images dans Wikimedia Commons. Les projets Élus et Parliamants sont toujours actifs sur Wikidata. Par ailleurs, le code source du site est disponible sous licence libre (AGPLv3) sur GitHub. Le code source des outils associés (Dicare Tools) est également disponible sur GitHub.