Archive

Articles taggués ‘Wikidata’
Aucun commentaire 24/02/2016

Wikidata pour la science

Une journée de découverte de Wikidata a été organisé le 2 février par Wikimédia France et le Center for Data Science de Paris-Saclay. Cette journée ouverte à tous s’est tenue au sein de l’Université Paris-Saclay, elle a été  pour une quarantaine d’universitaires et de doctorants de découvrir comment Wikidata parvient à constituer une des premières bases de connaissances au monde, et comment l’intégrer et l’exploiter dans les projets des étudiants et des chercheurs de l’université.

Le partage des données, avec comme objectif le Linked Data (Web des données), encore appelé Graphe Global Géant ou encore le Web 3.0, implique la constitution coûteuse de bases de connaissances, qui elles mêmes se périment très vite. L’alternative est l’élaboration collective de ces bases de connaissances de façon contributive.

Les divers domaines scientifiques sont déjà représentés dans Wikidata. Ces contributions peuvent être exploitées par exemple pour faciliter la découverte d’information, la reproductibilité et la traçabilité des travaux de recherche. Le Center for Data Science a travaillé sur les outils destinés à faciliter la découverte et la réutilisation des données de Wikidata.

Durant cette journée à travers des exemples réels et des travaux pratiques, les participants ont pu découvrir les travaux de recherche qui utilisent déjà les données de Wikidata et ces premiers outils.

Les sujets suivants ont été abordés durant la journée :

  • Qu’est-ce que Wikidata et Wikipédia ?
  • Quel est l’objectif de Wikidata ?
  • Comment peut-on contribuer, manuellement ou automatiquement à ce projet ?
  • Comment découvrir et utiliser les données de Wikidata ?
  • Quels sont les projets scientifiques qui utilisent déjà Wikidata dans lemonde et à l’université ?
  • Que peut apporter Wikidata pour partager les données de la recherche ?
  • Quels services propose le Center for Data Science de ParisSaclay dans ce domaine ?

Wikidata

La première moitié de la journée a été consacrée à une présentation de Wikidata par Sylvain Boissel, administrateur systèmes et réseaux de Wikimédia France et Harmonia Amanda, administratrice sur Wikidata.

Dernier né des projets Wikimedia, Wikidata a fêté ses trois ans en octobre dernier. Il s’agit d’une base de données collaborative placée sous licence CC0.

La présentation est organisée en trois parties, d’abord une présentation générale du site, puis les différents moyens de faire des requêtes sur la base de données et de la réutiliser et enfin comment contribuer à son amélioration.
Nouveau venu dans les bases de données en web sémantique, Wikidata a très vite pris une place centrale du fait de sa licence libre, de son aspect collaboratif et de la confiance qui lui est accordée concernant la stabilité du projet. C’est également un projet multilingue, gérant plus de 250 langues de façon native, et qui est encore en développement.

L’objectif premier du projet était proprement interne aux projets Wikimedia, puisqu’il s’agissait de centraliser les liens interwikis. Dans un deuxième temps, il s’agit de constituer une base de données structurée et réutilisable qui permette de stocker des données brutes ensuite utilisables sur les projets Wikimedia. Pour ce faire, il était nécessaire de construire une base de données requêtable et donc réutilisable plus largement.

La deuxième partie de la présentation s’intéresse aux façons de faire des requêtes sur la base de données pour pouvoir l’utiliser notamment les différents moyens de trouver un élément précis (les divers liens depuis Wikipédia, le système de recherche, la méthode de recherche par nom exact, etc.), présentation rapide de l’API et de son interface graphique.
Plusieurs exemples sont présentés :

  • réutilisations depuis Wikipédia : parsers functions, modules lua…
  • scripts en Python pour faire des requêtes et des insertions sur les sites Mediawiki (pywikibot)
  • interfaces de requêtes : Wikidata Query et SPARQL (query.wikidata.org)
  • outils spécialisés dans la réutilisation des données (outils de généalogie, de frises chronologiques, de cartes, ou encore de présentations plus lisibles pour des être humains que les éléments eux-mêmes)
  • réutilisations extérieures à Wikimédia sont également présentés

La troisième partie est consacrée à la contribution à Wikidata : créer un compte Wikimedia, paramétrer les langues d’interface, ajouter différents gadgets d’édition y compris des gadgets permettant des contributions semi-automatiques…

Retrouvez la présentation faite pendant cet atelier par ici.

Expérimentations Wikidata à Saclay

L’après midi, plusieurs chercheurs du plateau de Saclay ont présenté leurs travaux et la manière de se connecter à l’ontologie de Wikidata afin de mettre à disposition leurs données dans le Web des données.

Deux gadgets spécifiques pour Wikipédia ont été présentés. En effet, en copiant un petit bout de code dans la page de JavaScript personnalisée, les chercheurs du plateau de Saclay ont accès, depuis Wikipédia, à des onglets présentant des informations supplémentaires. Ainsi, directement depuis l’article de Wikipédia concernant un domaine de recherche, ils peuvent trouver les chercheurs compétents dans leurs domaines à l’Université de Paris-Sud (lien vers l’outil).

Autre exemple appliqué aux matériels disponibles pour les chercheurs, depuis l’article « spectromètre de masse », ils peuvent retrouver l’emplacement de tous les appareils disponibles de ce type disponibles sur le plateau (lien vers l’outil). Ces gadgets ont été présentés par Gregory Grefenstette (INRIA – TAO) et Valérie Cantonny (Institute of Plant Sciences Paris-Saclay IPS2 – Plateforme Métabolisme Métabolome)

Deux autres présentations concernaient la constitution de deux bases de connaissances ouvertes au sein de l’Université de Paris-Sud. Une base de connaissances ouverte pour les plateformes analytiques, par Sana Tfaili (Lip(Sys)2), puis une autre pour le droit canonique, nommée « projet Gregorius », par Julien Nauroy (Direction Informatique).

Karima Rafes (Paris-Sud / BorderCloud) a ensuite animé un atelier pratique, présentant comment interroger à l’aide du langage SPARQL les données de Wikidata à travers les outils du Center for Data Science.

La journée s’est terminée sur une table ronde accompagnée d’un débat avec le public. Les participants se sont interrogés sur la place de Wikidata dans la science, et la place de la science dans Wikidata. Les réflexions ont porté, notamment sur la faisabilité d’établir une ontologie couvrant l’ensemble du savoir humain, et sur les besoins des chercheurs en matière de bases de connaissances : s’ils sont souvent trop spécifiques pour que les données soient mises directement sur Wikidata, les bases peuvent en revanche être reliées entre elles par le biais des éléments Wikidata.

Prochain atelier de présentation de Wikidata : jeudi 25 février à 19:30 à La Paillasse (226 rue Saint Denis, 75002 Paris)

par Sylvain Boissel
Categories: Projets Wikimedia, Wikidata
Aucun commentaire 21/02/2013

Wikidata lancé sur la Wikipédia en anglais

Ce billet est issu d’une traduction de l’annonce sur le blog de Wikimedia Deutschland. Le billet original a été publié sous CC-BY-SA 3.0 par Lydia Pintscher le 13 février 2013.

Après le déploiement de la première phase de Wikidata sur les Wikipédias en hongrois, hébreu et italien, l’anglais a été ajouté à la liste aujourd’hui.
Cela signifie que les liens interlangues sur cette Wikipédia viennent également maintenant de Wikidata. C’est une autre étape sur le chemin menant à un système où les liens interlangues sont stockés dans un seul emplacement central (à l’opposé du wikitexte de chaque article sur chaque Wikipédia).
Logo de Wikidata

Logo de Wikidata

Que se passe-t-il exactement ?

  • Les liens interlangues dans la barre de gauche viendront automatiquement de Wikidata, une fois l’article lié à Wikidata. Aucune syntaxe spéciale n’est requise pour ça.
  • Les liens interlangues existants continueront de fonctionner et auront priorité sur les liens de Wikidata.
  • Pour chaque article, les liens interlangues de Wikidata peuvent être supprimés complètement par le mot magique noexternallanglinks.
  • Les changements sur Wikidata liés aux articles de cette Wikipédia seront visibles dans les modifications récentes et les listes de suivi, si l’option est activée par l’utilisateur. (Il y a encore quelques problèmes avec ça quand vous avez activé les modifications récentes groupées.)
  • En bas de la liste des liens interlangues, vous trouverez un lien pour éditer les liens interlangues, ce qui vous mène vers la page liée sur Wikidata.
  • Vous pouvez voir un exemple de la façon dont ça se présente sur l’article concernant Maria Goeppert-Mayer.
  • La seconde phase de Wikidata (à propos des infoboxes) a été démarrée sur Wikidata, mais ne peut pas encore être utilisée sur les Wikipédias. Cela suivra plus tard.
Une FAQ est disponible.

Qu’y a-t-il ensuite ?

Les premières parties de la phase 2 ont été déployées sur wikidata.org. Nous travaillons maintenant sur les parties manquantes de la phase 2. Ceci comprend par exemple la possibilité d’entrer des dates et des coordonnées géographiques.
En même temps, nous préparons le déploiement sur toutes les autres Wikipédias. Ceci est planifié pour le 27 février, mais en raison d’un grand nombre de réunions dans les bureaux de la Wikimedia Foundation, cela sera peut-être avancé ou retardé de quelques jours. Nous vous tiendrons au courant.

Office hour

Si vous avez des questions, vous êtes par exemple le bienvenu pour venir à une des prochaines office hours sur IRC.
par Seb35
Categories: Wikidata