Wikidata donne des ailes au savoir libre

Comment les assistants vocaux tels qu’Alexa et Siri ont-ils réponse à tout ? Comment les moteurs de recherche peuvent-ils vous indiquer l’altitude du Kilimandjaro (5895 mètres) si rapidement et si précisément ? Aujourd’hui plus que jamais, c’est grâce aux plus de 60 millions d’entrées contenues dans les bases de données ouvertes de Wikidata.

Wikidata est un projet de Wikimedia, l’organisation à but non lucratif qui gère également l’encyclopédie en ligne Wikipedia. Depuis six ans, les contributeurs bénévoles de Wikidata structurent les données afin de les rendre lisibles et éditables par des humains et des machines.

Ainsi, les informations peuvent circuler librement entre le Web et d’autres plateformes technologiques.  Au fur et à mesure qu’augmente le nombre de personnes qui interagissent avec Internet, via le Web et des sites comme Wikipédia, mais aussi dans les échanges vocaux et audio avec des appareils, l’interopérabilité gagne en importance.

Les machines peuvent comprendre Wikidata parce qu’elles analysent les informations que vous lisez habituellement dans un article de Wikipedia en blocs séparés. Par exemple : « Paris est la capitale de la France. » « Paris compte 2 206 4988 habitants. » « Les coordonnées géographiques de Paris sont 48°51’23.68″N, 2°21’6.58″E. »

Par la structuration de ces informations et l’attribution d’un identifiant unique à chaque entrée, Wikidata propose à plus de 5000 sites web, archives, bibliothèques et bases de données une colonne vertébrale commune : lorsqu’une entrée est mise à jour, les entrées qui font référence à cette dernière sont automatiquement actualisées, dans chaque langue.

Wikidata ne constitue pas la seule initiative qui cherche à organiser, ou du moins essayer d’organiser, les données du Web. Des projets similaires ont connu des difficultés en raison de l’ampleur de la tâche. Quelle est la recette du succès de Wikidata ? « La communauté représente le plus grand atout de Wikimedia », déclare Lydia Pintscher, chef de produit chez Wikidata. « Le projet n’existerait pas sans nos partenaires, nos contributeurs et les utilisateurs des données. » 

En effet, les dizaines de milliers de contributeurs bénévoles de Wikidata ont fourni collectivement plus de 850 millions d’éditions au fil des ans.

Wikidata se distingue également par son statut de ressource du domaine public entièrement ouverte : l’attribution de la licence universelle Creative Commons CC0 de transfert dans le domaine public à toutes les données de Wikidata autorise les particuliers et les entreprises à utiliser Wikidata librement et sans restriction de droits d’auteur, à toutes fins, des assistants vocaux aux moteurs de recherche.

Pour Wikidata, la mise à disposition des données en libre accès et sans mention de source signifie que les personnes qui bénéficient de ces informations ne connaissent généralement pas leur origine et ne savent pas que Wikidata dépend de bénévoles et des dons pour mener à bien son travail, y compris les mises à jour et les contrôles de qualité.

Les grandes entreprises du secteur technologique, qui proposent des services basés sur Wikidata et d’autres initiatives de Wikimedia, ont le devoir d’aider à maintenir cette ressource pour tous. « Alors que les entreprises font appel à Wikipédia pour obtenir des connaissances – et comme rempart contre les fausses informations – nous croyons qu’elles aussi devraient saisir l’occasion de se montrer généreuses », soutenait Katherine Maher, directrice générale de Wikimedia, dans une tribune du site WIRED en 2018 où elle appelait les sociétés à contribuer financièrement au travail mis à disposition par la communauté.

Google, Amazon et d’autres ont répondu à cet appel à différents niveaux (Amazon a cité Wikipedia comme l’une des raisons du succès de son assistant Alexa), mais la grande majorité des ressources de Wikimedia proviennent de dons de plus de six millions d’internautes qui contribuent en moyenne à hauteur de 10 USD. En 2018, seulement 4 % du financement provenait de sociétés.

Le libre accès au savoir et à l’information représente un pilier essentiel de la santé d’Internet. Pour les institutions, les entreprises, les organisations et les individus qui possèdent des jeux de données, restreints ou volumineux, à partager avec le reste du monde, Wikidata constitue le lieu où celles-ci peuvent réellement s’avérer utiles.

Wikidata se distingue également par son statut de ressource du domaine public entièrement ouverte : l’attribution de la licence universelle Creative Commons CC0 de transfert dans le domaine public à toutes les données de Wikidata autorise les particuliers et les entreprises à utiliser Wikidata librement et sans restriction de droits d’auteur, à toutes fins, des assistants vocaux aux moteurs de recherche.

Pour Wikidata, la mise à disposition des données en libre accès et sans mention de source signifie que les personnes qui bénéficient de ces informations ne connaissent généralement pas leur origine et ne savent pas que Wikidata dépend de bénévoles et des dons pour mener à bien son travail, y compris les mises à jour et les contrôles de qualité.

Les grandes entreprises du secteur technologique, qui proposent des services basés sur Wikidata et d’autres initiatives de Wikimedia, ont le devoir d’aider à maintenir cette ressource pour tous. « Alors que les entreprises font appel à Wikipédia pour obtenir des connaissances – et comme rempart contre les fausses informations – nous croyons qu’elles aussi devraient saisir l’occasion de se montrer généreuses », soutenait Katherine Maher, directrice générale de Wikimedia, dans une tribune du site WIRED en 2018 où elle appelait les sociétés à contribuer financièrement au travail mis à disposition par la communauté.

Google, Amazon et d’autres ont répondu à cet appel à différents niveaux (Amazon a cité Wikipedia comme l’une des raisons du succès de son assistant Alexa), mais la grande majorité des ressources de Wikimedia proviennent de dons de plus de six millions d’internautes qui contribuent en moyenne à hauteur de 10 USD. En 2018, seulement 4 % du financement provenait de sociétés.

Le libre accès au savoir et à l’information représente un pilier essentiel de la santé d’Internet. Pour les institutions, les entreprises, les organisations et les individus qui possèdent des jeux de données, restreints ou volumineux, à partager avec le reste du monde, Wikidata constitue le lieu où celles-ci peuvent réellement s’avérer utiles.

A quelles données souhaiteriez-vous que le monde ait plus d'accès ?

  1. Des ontologies pour les sciences humaines … et pour les autres – AHP numérique

    […] Wikidata donne des ailes au savoir libre, Lydia Pintscher, 2019, moz://a : Lien […]

  2. Wikidata donne des ailes au savoir libre – Veille patrimoniale

    […] Accéder à l’article  […]