Archive

Archives pour 11/2012
Aucun commentaire 26/11/2012

Retour sur le partenariat Sémanticpédia avec le ministère de la Culture et l’Inria

Lundi 19 novembre dernier, Wikimédia France a eu la joie de signer un partenariat exceptionnel avec le ministère de la culture et Inria.

Ce partenariat met en place la plate-forme Sémanticpédia, dédiée à la sémantisation des contenus des projets Wikimédia.

Signature de la convention Sémanticpédia

Signature du partenariat Sémanticpédia par Michel Cosnard (Inria), Aurélie Filippetti (Ministre de la Culture) et Rémi Mathis (Wikimédia France) - par Thesupermat - CC-BY-SA

Le projet, initié il y a un an, a commencé par une extraction sémantique de la version francophone de Wikipédia. À cette occasion le projet est devenu correspondant (chapitre) français du projet Dbpedia.org, qui depuis 2007 travaille à l’extraction sémantique de Wikipédia. La nouveauté ici est de travailler directement sur la Wikipédia en français et non plus à partir de la Wikipédia en anglais, ce qui permet de traiter tous les articles de Wikipédia en français et non seulement ceux qui disposent d’un interwiki avec Wikipedia en anglais. C’est-à-dire que nous avons « gagné » entre 20 et 30% d’articles supplémentaires à extraire, fortement reliés à la culture française et francophone.

La suite du projet devrait voir naître une extraction sémantique du Wiktionnaire et pourquoi pas d’autres projets Wikimédia.

La ministre de la culture, Aurélie Fillipetti, a souligné l’importance d’une présence francophone sur le web de données, qui prend de plus en plus d’importance dans les architectures de gros sites internet et pour interconnecter les contenus et les données dans des projets de réutilisation de contenu. Rappelant l’importance, tant numérique que dans les usages, de Wikipédia sur internet, elle a expliqué pourquoi le ministère de la Culture désirait soutenir un projet concret de mise en relation des données entraînant indirectement une promotion de la langue et de la culture francophones sur internet.

Mais, allant plus loin, elle a également invité les institutions culturelles à directement contribuer sur Wikipédia, afin d’enrichir ces contenus qui, ensuite extraits par DBpedia, seront réutilisés très largement. Prônant un cercle vertueux là où les institutions pourraient apporter leur pierre experte à un édifice ensuite rediffusé à tous, cette invitation est une vraie reconnaissance de la place et de la qualité de Wikipédia et de ses contributeurs, ainsi qu’un appel à davantage participer au partage de la connaissance pour les institutions culturelles :

« Le partenariat entre le ministère de la culture, Wikimédia et Inria offre aux établissements culturels la possibilité d’enrichir de manière considérable les ressources culturelles mises à la disposition des internautes. Dans leurs domaines d’expertise, les établissements culturels ont tout intérêt à rejoindre leurs publics, là où ils viennent chercher l’information de première nécessité. Le caractère libre et réutilisable des informations présentes sur l’encyclopédie Wikipédia, disponibles sous plusieurs licences ouvertes, est à cet égard un gage de diffusion aussi large que possible des données qu’elle rassemble.

Mais ce partenariat ne saurait être à sens unique. Le savoir accessible sur Wikipédia est en perpétuelle construction et peut bénéficier pleinement de l’expertise du ministère. C’est pourquoi nos établissements sont invités à leur tour à consolider, à enrichir ou à rectifier s’il y a lieu les données figurant sur Wikipédia, afin non seulement d’augmenter la qualité de ses articles en langue française, mais aussi son efficacité sur le Web sémantique. » (discours d’Aurélie Filippetti, ministre de la Culture, le 19 novembre 2012)

Comment_utiliser_DBpédia_en_français_-_Semanticpedia_2012

Table-ronde « comment utiliser DBpedia en français ? » - par Thesupermat - CC-BY-SA

Dans ce partenariat, le ministère de la Culture tient une place importante de soutien et de financeur de projetInria (Institut national de recherche en informatique et en automatique), centre de recherche renommé, apporte le développement technique et son expertise sur le web sémantique. Wikimédia France fait le lien avec les communautés wikimédiennes de contributeurs et donne sa connaissance des projets et de leur fonctionnement. Pour l’instant hébergée par Inria, la plate-forme Sémanticpédia sera à terme hébergée par Wikimédia France avec le soutien du ministère de la Culture.

D’ores et déjà, certains sites webs d’institutions culturelles commencent à réutiliser les données de Wikipédia via DBPedia pour enrichir et organiser leurs contenus, comme le site expérimental HDA-lab du ministère de la Culture et très bientôt la Cité de la Musique.

Wikimédia France est fière de participer à ce projet inédit de partenariat original entre un ministère public, un institut de recherche et une association de soutien aux projets Wikimédia, dédié au partage de la connaissance et à l’ouverture des données.

La signature du partenariat a été suivie d’une journée de présentation du projet et de ses potentialités, accompagnée de démonstrations de premières réutilisations ainsi que d’une table-ronde sur les projets de collaboration entre institutions culturelles et Wikimédia France. Plus de 200 personnes ont assisté à cette journée de signature, d’échanges et d’étude.

  • Diapositives des présentations lors de la journée de signature
2 commentaires 09/11/2012

Le nouveau lecteur vidéo de Wikipédia

Un nouveau lecteur vidéo a été déployé sur Wikipédia et ses projets frères, et avec lui vient la possibilité d’apporter des vidéos pédagogiques libres à davantage de personnes, sur davantage de plate-formes, dans davantage de langues.

Le lecteur est le même que le lecteur HTML5 utilisé par la plate-forme de vidéo open-souce Kaltura. Il a été intégré à MediaWiki (le logiciel qui propulse les sites Wikimédia dont Wikipédia) via une extension nommée TimedMediaHandler. Il remplace l’ancien lecteur Ogg utilisé depuis 2007.


Le nouveau lecteur vidéo a un support pour les sous-titres en de multiples langues.
(Eben Moglen, CC-BY-SA)

Basé sur HTML5, le nouveau lecteur lit des fichiers audio et vidéo depuis les pages Wiki. Il apporte de nombreuses fonctionnalités, comme le support pour les sous-titres et le Timed Text. En permettant aux contributeurs de transcrire les vidéos, le nouveau lecteur est un pas important vers l’accessibilité aux personnes mal-entendantes. Les sous-titres peuvent être aisément traduits, élargissant ainsi leur public potentiel.

TimedMediaHandler apporte également d’autres fonctionnalités utiles, comme le support du format multimédia ouvert WebM. Le support de WebM permet de téléverser de façon transparente les vidéos encodées dans ce format, comme par exemple toutes les nombreuses vidéos sous licence libre présentes sur YouTube.

Encore davantage “sous le capot”, TimedMediaHandler supporte le transcodage côté serveur, c’est à dire la capacité à convertir une vidéo d’un format à un autre, dans le but de fournir un flux vidéo approprié à l’utilisateur, en fonction de sa bande passante et de la taille du lecteur. Par exemple, le support des formats mobiles est possible, bien qu’il ne soit pas encore activé. La fonctionnalité “Partager” du lecteur fournit un court extrait de code pour insérer directement les vidéos de Wikimedia Commons dans les pages web et les billets de blog.

La fonctionnalité “Partager” du lecteur fournit un extrait de code pour insérer directement des vidéos de Wikimedia Commons dans les pages web, comme ici.
(Vidéo par Frank Vincentz, CC-BY-SA)

Soutenus par Kaltura et Google, les développeurs Michael Dale et Jan Gerver sont les principaux architectes du déploiement réussi du nouveau lecteur. Avec le soutien de l’équipe d’ingénierie de la Wikimedia Foundation et de Kaltura, ils ont procédé à de nombreux cycles de déploiement, révision et test avant de pouvoir enfin publier le fruit d’années de travail.

Les efforts pour mieux intégrer les contenus vidéos sur Wikipédia et les projets frères remontent à 2008, lorsque Kaltura et la Wikimedia Foundation annoncent leur première expérimentation commune en matière de vidéos. Depuis, des améliorations incrémentales ont été publiées, mais le déploiement de TimedMediaHandler est le plus franc succès à ce jour.

Les utilisateurs de Wikimedia Commons avaient déjà accès à certaines des fonctionnalités de TimedMediaHandler durant le développement, sous une forme expérimentale. Les utilisateurs enregistrés pouvaient activer la beta dans leurs préférences pour disposer d’une meilleure interface et pouvoir modifier des sous-titres. Puisque le nouveau lecteur est compatible avec les sous-titres créés durant cette période, nous disposons dès à présent d’un large corpus déjà fonctionnel − par exemple ce montage d’interviews de Wikipédiens.

Wikimedia Commons est la médiathèque de Wikipédia et des projets frères. Elle constitue l’archive de tous leurs contenus multimédia. Même si une vidéo est hébergée ailleurs, les sites Wikimedia ont besoin de leur propre copie pour assurer que la ressource reste disponible même si ces sites venaient à disparaître. Du point de vue de la vie privée, cela assure aussi que les informations personnelles des utilisateurs ne sont pas transmises à des sites tiers. Le nouveau lecteur respecte également les licences libres en affichant les informations sur l’auteur à la fin de la vidéo, quel que soit le site où elle est intégrée.

Cet engagement s’accompagne d’importants défis techniques. Pour de nombreux sites, afficher une vidéo est aussi simple que de l’insérer depuis une plate-forme comme YouTube ou Vimeo. En utilisant un simple code HTML, n’importe-quel blogueur peut insérer une vidéo directement dans leurs pages web, sans se soucier de l’espace disque, des codecs, du support des navigateurs ou de la bande passante.

Bien que les sites Wikimédia soient de bien plus modestes plate-formes d’hébergement vidéo, il leur faut aussi répondre à ces questions difficiles. Par exemple, les ingénieurs de la Wikimedia Foundation se sont lancés dans la longue refonte de l’infrastructure de stockage de vidéos, afin de pouvoir suivre les besoins en stockage pour les contenus multimédia. Plus récemment, ils ont amélioré la performance des serveurs de cache pour servir des vidéos.

Le défi technique de la vidéo sur Wikipedia ne se limite pas à fournir le contenu aux lecteurs : importer ces vidéos est tout aussi important, en raison de la nature participative des sites Wikimedia. Apporter des contenus vidéos originaux de qualité à Wikipédia est plus difficile que de modifier du texte sur une page wiki.

En 2010, l’Open Video Alliance a lancé une campagne appelée « Let’s Get Video on Wikipedia » ( « mettons de la vidéo sur Wikipédia »). Ce projet avait pour but d’inciter les gens à créer du contenu vidéo et le mettre en ligne sur Wikimedia Commons. Il comportait un tutoriel et un assistant expérimental pour insérer des vidéos dans les articles de Wikipédia.

L’“UploadWizard“, un assistant de mise en ligne pas-à-pas développé par la Wikimedia Foundation en 2010-2011, a été crucial pour rendre la participation au multimédia plus accessible et intuitive. Des améliorations sont en cours de développement, qui faciliteront la contribution vidéo, comme le téléversement « par morceaux », actuellement expérimental, qui permet une meilleure fiabilité des transferts de gros fichiers.

Sur Internet, la vidéo est très statique : une fois mise en ligne, elle est rarement modifiée. À l’inverse, le succès de Wikipédia repose sur le grand nombre des bénévoles qui modifient et améliorent constamment les contributions les uns des autres.

Des outils adaptés vont heureusement réduire cette dissonance, comme le séquenceur de Kaltura, qui permet aux utilisateurs de directement remixer des vidéos en ligne. Le succès de l’adaptation de sa nature coopérative aux contenus multimédia sera crucial pour le passage de Wikipédia à l’ère de la vidéo.

Guillaume Paumier.
Technical communications manager


Ce billet, Introducing Wikipedia’s new HTML5 video player, a été écrit par Guillaume Paumier et publié sur le blog de la Wikimedia Foundation sous licence CC-BY, et a été traduit en français par Jean-Frédéric et El Caro avec l’aide de Pleclown, Mathilde et Moyg.