Aucun commentaire 14/05/2012

Les atouts de la connaissance libre

Traduction de l’article « The power of free knowledge » de Geoff Brigham, conseiller juridique de la Wikimedia Foundation, publié le 29 mars 2012.

Petit globe Wikipédia présenté au creux de mains anonymes.

Crédit photographique : Lane Hartwell, CC-BY-SA.

Après le récent blackout destiné à lutter contre SOPA/PIPA, de nombreux médias ont décrit le débat comme une lutte d’influence entre la Silicon Valley et Hollywood. Sous cet exposé à courte vue, se cache la vérité, à savoir que les millions d’utilisateurs réguliers d’internet qui ont appelé leurs représentants au Congrès et leur ont écrit ont ainsi donné une voix collective à leur demande au Congrès de ne pas adopter, sous la dictée de l’industrie, une législation qui nuirait à un web libre et ouvert. Ils se sont manifestés pour soutenir ces sites web innovants et ces communautés en ligne qui sont possibles uniquement à travers un libre échange d’idées et d’informations.

Le Congrès, les médias et beaucoup d’autres ne comprennent ou n’apprécient pas toujours le sens et la puissance du mouvement pour la connaissance libre ni la communauté qui le nourrit et le porte. C’est pourquoi nous voulons offrir un résumé de ce qu’est la connaissance libre. Une grande partie en sera familière aux contributeurs des projets Wikimédia et à nos homologues de la communauté pour la connaissance libre, mais nous espérons que cela puisse être utile à nos autres lecteurs – et législateurs – qui n’ont pas encore exploré la question ou qui ont été surpris par les réactions en retour lorsqu’ils l’avaient tout à fait ignorée.

Comme vous pouvez l’imaginer, nous sommes très enclins à protéger l’internet, qui facilite largement la libre circulation de la connaissance, et nous sommes méfiants lorsque certains cherchent à le pilonner par une législation favorable à leurs intérêts privés et exempte de toute réflexion qui soit adaptée aux valeurs vitales pour notre mission.

Ce qu’il faut savoir sur la connaissance libre

La mission de la communauté pour la connaissance libre est de créer et de partager des ressources informationnelles et des œuvres culturelles en pleine conformité avec les lois sur le copyright [et les droits d’auteur]. En offrant leurs travaux [ou œuvres ; works], leurs créateurs garantissent toutefois cinq libertés : liberté d’utiliser, liberté d’étudier, liberté de copier, liberté de redistribuer et liberté d’améliorer les travaux [ou œuvres] en question1. Des auteurs, artistes, photographes, chercheurs, et d’autres, qui ont rejoint partout dans le monde la communauté pour la connaissance libre se sont engagés en faveur de ces libertés, et à leur tour ils produisent des médias que des centaines de millions de gens peuvent utiliser. Le résultat, ce sont des matériaux sous licence libre précieux pour l’éducation, l’entreprise, la technologie, la science et la culture dans le monde entier.

Les créateurs de la communauté pour la connaissance libre sont en fait titulaires de droits d’auteur, exactement comme les créateurs de l’industrie des médias, mais contrairement à ce qui se pratique dans la plupart des industries, les créateurs de la communauté pour la connaissance libre ont la volonté de favoriser le progrès et l’innovation en plaçant leurs travaux sous licence libre et donc de mettre leurs créations à disposition de tous librement.

La communauté pour la connaissance libre est présente partout dans le monde, elle est diverse et en continuelle croissance. Près de 200 millions de travaux [d’œuvres] librement accessibles sont désormais disponibles et le nombre de contenus nouveaux placés sous licence libre augmente rapidement2. Beaucoup d’organisations3 ont maintenant d’importants dépôts de contenus sous licence libre, parmi lesquelles C-Span4, YouTube5, Vimeo6 et Flickr7. Wikipédia offre plus de 21 millions d’articles en 283 langues 8. La communauté Wikipédia est construite sur le travail de centaines de milliers de contributeurs du monde entier. Wikimedia Commons accueille plus de 12 millions de fichiers, dont plus de dix millions d’images et de photographies, plus de cent mille fichiers son et plus de vingt mille scans de documents sous licence libre ou dans le domaine public9.

Ces travaux sont tous disponibles pour les citoyens, les entreprises, les bibliothèques, les chercheurs et les institutions culturelles, sans frais. Une recherche commence souvent avec des résumés de Wikipédia et des listes de références renvoyant en lien à des sources primaires10. Les spécialistes comptent sur la connaissance libre aussi bien que sur les moteurs de recherche internet et les bases de données des publications savantes. Les bibliothèques contribuent à la diffusion de la connaissance libre et permettent de toucher de nouveaux publics11. Les enseignants s’appuient sur des documents écrits et des photographies pour préparer leurs classes à des coûts minimes, où qu’ils soient dans le monde.

La libre diffusion des connaissances donne aux entreprises et aux entrepreneurs un accès à faible coût à un immense champ d’informations sur de nombreux sujets. Les entreprises économisent de l’argent sur la recherche et ont un accès instantané à l’information à partir d’un large éventail de perspectives12. La connaissance libre est particulièrement bénéfique aux petites entreprises qui autrement ne pourraient pas s’offrir le matériel de recherche adéquat : elle réduit les barrières à l’entrée en activité et encourage l’innovation13.

Des contenus libres sont fréquemment intégrés à d’autres services. Les articles de Wikipédia sont réutilisés par des produits et des services commerciaux14, allant de Facebook et Amazon.com aux sites web de la BBC15. Des milliers d’images issues de Commons ont été republiées dans des livres, des journaux et d’autres médias16. Les journalistes ont un accès immédiat à des photographies informatives et percutantes provenant de toute la planète, et les développeurs de logiciels peuvent incorporer à leurs applications des médias, du contenu encyclopédique ou des entrées de dictionnaire, sans payer aucun frais17. La connaissance libre offre aux chercheurs un corpus de travaux leur permettant d’en apprendre davantage dans leur domaine d’intérêt et de participer à leur tour à l’innovation, à l’élaboration de nouvelles théories et à de nouvelles découvertes18.

Comme indiqué précédemment, l’engagement à la collaboration et au partage est au cœur du mouvement pour la connaissance libre. Ces idéaux ne sont pas nouveaux et ils sont conçus pour compléter et profiter à notre système actuel de droits d’auteur en créant l’opportunité de nouvelles œuvres originales et d’améliorations d’œuvres existantes19. Internet doit aujourd’hui faciliter une innovation continue basée sur des œuvres sous licence libre ou appartenant au domaine public : en fin de compte, c’est un outil visant à faciliter ces importantes interaction, communication et collaboration, ce qui stimulera l’innovation et mettra en valeur la libre circulation de la connaissance. C’est pour cette raison que nous exhortons les lecteurs et le Congrès à considérer les valeurs d’un internet ouvert et libre, qui renforce tous les avantages de la libre circulation de la connaissance pour nos concitoyens, entreprises, bibliothèques, chercheurs et organismes culturels.

Pour en savoir plus, n’hésitez pas à lire les pages consacrées aux contenus libres sur Wikipédia ou bien à visiter le site Creative Commons20.

Geoff Brigham, avocat en chef
Stephen LaPorte, assistant juridique

Notes

  1. Dans le sens plein du terme, « libre » signifie « liberté d’utiliser les travaux [l’œuvre ; work] et de jouir des avantages de leur utilisation ; liberté d’étudier les travaux [l’œuvre ; work] et d’appliquer les connaissances acquises à partir de ceux-ci ; liberté de faire et diffuser des copies, en totalité ou en partie, de l’information ou de la création ; liberté d’apporter des changements et des améliorations, ainsi que de distribuer des œuvres dérivées ». Voir http://freedomdefined.org/Definition. []
  2. En 2003, les licences Creative Commons existaient seulement depuis un an et elles concernaient moins d’un million de documents. Sept ans plus tard, en 2010, ce chiffre s’élevait à un total de plus de 400 millions. Plus de 40% de ces travaux sont entièrement libres ou ouverts. Voir Mike Linksvayer, « The Power of Open: over 400 million CC-licensed works, with increasing freedom », Creative Commons, 27 juin 2011. []
  3. En 2011, Creative Commons a recueilli les récits de membres de la communauté pour la connaissance libre ; à consulter en ligne : http://wiki.creativecommons.org/The_Power_of_Open/Text. []
  4. C-Span place ses vidéos sous licence Creative Commons Attribution 3.0 sur YouTube. []
  5. YouTube permet maintenant à chacun de mettre ses contributions sous licence Creative Commons Attribution. Voir Jane Park, « YouTube launches support for CC BY and a CC library featuring 10,000 videos », Creative Commons, 2 juin 2011. []
  6. Vimeo permet de sélectionner les vidéos utilisant une licence Creative Commons : « Nos membres adorent utiliser les licences Creative Commons, afin de retravailler les contenus, les remixer et réinventer. C’est pourquoi nous avons construit toute une nouvelle section pour vous aider à découvrir des vidéos disponibles sous licences Creative Commons. » Voir http://vimeo.com/new. []
  7. Flickr permet aux utilisateurs de mettre leurs photographies sous licence Creative Commons. Voir http://www.flickr.com/creativecommons. []
  8.  Key Facts about Wikipedia, janvier 2012 (pdf). Les statistiques prenant en compte toutes les versions linguistiques de Wikipédia sont disponibles ici : http://stats.wikimedia.org/EN/TablesWikipediaZZ.htm. []
  9. http://commons.wikimedia.org/wiki/Commons:MIME_type_statistics. []
  10. Sook Lim, « How and Why Do College Students Use Wikipedia? », Journal of the American Society for Information Science and Technology, novembre 2009 ; les résultats d’enquêtes aditionnelles ont été analysés en 2010, montrant que les étudiants continuent à utiliser Wikipédia comme une source de recherche. Voir Alison J. Head and Michael B. Eisenberg, « How today’s college students use Wikipedia for course–related research », First Monday, volume 15, numéro 3, 1er mars 2010. []
  11. Steve Kolowich, « Wielding Wikipedia », Inside Higher Ed, 5 avril 2011. []
  12. Une étude a montré qu’à des fréquences d’édition plus élevées d’un article de Wikipédia sur une entreprise correspondait une réduction des erreurs d’analyse, ce qui suggère que la fréquence d’édition serait une indication de l’attention que porte le public à cette entreprise. Amir Rubin and Eran Rubin, « Informed Investors and the Internet », Journal of Business Finance & Accounting, 37: 841–865, 2010 (doi: 10.1111/j.1468-5957.2010.02187.x). []
  13. Plus généralement, voir Wouter Tebbens, Hinde ten Berge et David Jacovkis, The Knowledge Society: a freedom-centered perspective, intervention présentée à la Free Culture Research Conference, Berlin, 2010. []
  14. Voir les lignes directrices de Wikipédia pour la réutilisation du contenu décrites ici : http://fr.wikipedia.org/wiki/Wikipédia:Citation_et_réutilisation_du_contenu_de_Wikipédia. []
  15. BBC Music, BBC Wildlife Finder et encore d’autres sites de la BBC intègrent des contenus provenant de Wikipédia. Voir Yves Raimond, Tom Scott, Silver  Oliver, Patrick Sinclair et Michael Smethurst, Use of Semantic Web Technologies on the BBC Web Sites, Linking Enterprise Data, 2010. Facebook réédite également des contenus d’articles de Wikipédia. Voir Jane Park, « Wikipedia on new Facebook community pages », 21 avril 2010 ; et pour une liste des centaines de sites qui réutilisent le contenu de Wikipédia, voir http://en.wikipedia.org/wiki/Wikipedia:Mirrors_and_forks/All. — Pour un public francophone, on peut aussi mentionner l’exemple emblématique du site de la Bibliothèque nationale de France data.bnf.fr qui reprend également des contenus issus de Wikipédia (N.d.T.) []
  16. http://commons.wikimedia.org/wiki/Category:Commons_as_a_media_source. []
  17. Des centaines d’applications proposées sur les sites d’Apple, de Google et d’Amazon reprennent des contenus sous licence libre provenant des projets Wikimédia. []
  18. http://meta.wikimedia.org/wiki/Research []
  19. L’article I, section 8, clause 8 [de la Constitution américaine, relatif aux droits d’auteur et appelé Copyright’s Clause (N.d.T.)], formule comme premier objectif de « promouvoir le progrès des sciences et de l’invention… ». La communauté pour la libre connaissance abandonne volontairement l’exclusivité de ses droits sur un bien, le faisant devenir commun et public, pour promouvoir innovation, imitation, émulation, accroissement du patrimoine culturel, processus démocratique et autres avantages que peut apporter la liberté. En effet, la Cour suprême a toujours estimé que l’objectif ultime du Copyright’s Clause était de « stimuler la créativité artistique pour le bien public en général ». []
  20. les organisations impliquées dans le mouvement pour la libre diffusion de la connaissance comprennent Creative Commons, la Free Software FoundationPublic Knowledge, l’Electronic Frontier Foundation, le Center for Democracy and Technology, l’Open Knowledge Foundation et Knowledge Ecology International. []
Aucun commentaire 09/05/2012

La photo au musée : vers une solution ?

La question de la photo au musée n’est pas récente mais, comme beaucoup de choses, a pris une acuité nouvelle avec le développement du numérique. Chacun dispose de la possibilité de prendre des dizaines de photographies en quelques heures, souvent sans autre appareil que celui qu’il a sur lui en permanence. Face à ces changements, certains musées ont interdit de prendre des photographies de leurs collections, bien qu’ils soient d’État (relevant donc de la domanialité publique) ou imposent des conditions de réutilisation particulières des photos prises par les visiteurs (bien que ces pièces appartiennent au domaine public).

Cela a abouti à des bras de fer voire à des actions revendicatives comme au musée d’Orsay, où le groupe Orsay Commons se réunit régulièrement pour prendre des photographies en dépit de l’interdiction.

Prenant acte d’une incompréhension et de la nécessité de discuter afin de mieux comprendre la position des uns et des autres − et si possible d’arriver à un consensus sur ce qui est souhaitable − Wikimédia France s’est associée il y a quelques mois à une lettre ouverte au ministère de la Culture.

Paris, le 20 février 2012

Monsieur le Ministre,

Nous nous permettons d’interpeller le ministère de la Culture au sujet de la pratique photographique et filmique des visiteurs dans les musées et monuments.

Compte tenu des avancées technologiques continues, de la miniaturisation des appareils, de leur intégration dans les téléphones portables et de la généralisation de leur utilisation parmi la population, les établissements patrimoniaux se retrouvent confrontés à des manières de visiter où la prise de vue prend de plus en plus d’ampleur.

Ces comportements nouveaux peuvent parfois générer des problèmes dans les établissements les plus fréquentés, en terme de gestion des flux, de respect entre visiteurs, de confort de travail pour les personnels tout en soulevant des questions quant à la diffusion des images ensuite sur Internet.

Certaines réactions visent à interdire toute pratique, comme des musées sont actuellement tentés de le faire. D’autres institutions y voient au contraire une vraie pratique culturelle et un formidable outil de médiation. Elles l’utilisent comme mode d’appropriation, de partage, et de diffusion d’œuvres notamment du domaine public. C’est, qui plus est, un outil puissant de visibilité et de promotion pour les établissements.

Afin d’inventer ensemble des dispositifs et des aménagements qui intégreraient au mieux ces pratiques à la visite de musées et monuments, et préoccupés par l’hétérogénéité des règles selon les établissements, nous souhaiterions pouvoir organiser des réunions sous l’égide de votre ministère entre acteurs concernés : publics, amis des musées, associatifs, sociologues et chercheurs.

Pour que la rencontre soit profitable, il est bien entendu indispensable qu’y soient conviés des représentants de musées, directions comme personnels.

Nous serions heureux d’y voir associés des représentants aussi bien du Musée d’Orsay qui a interdit la pratique depuis 2010, que du Musée du Louvre qui après l’avoir partiellement interdite l’a à nouveau autorisée suite à une étude, ou encore du Château de Versailles qui est à l’initiative de plusieurs concours photos, et du Muséum de Toulouse, pionnier dans le domaine de l’intégration des pratiques photographique des visiteurs.

Persuadés que vous serez sensible à notre démarche, nous vous prions d’agréer, Monsieur le Ministre, l’expression de notre haute considération.

Signataires :

  • Serge Chaumier, muséologue, professeur des universités
  • Julien Dorra, OrsayCommons. co-organisateur de Museomix
  • Bernard Hasquenoph, Louvre pour tous, OrsayCommons
  • Rémi Mathis, président de Wikimédia France
  • Jean-Michel Raingeard, président de la Fédération Française des Sociétés d’Amis de Musées (FFSAM)

Nous savons gré à la direction générale des patrimoines du ministère de la Culture d’avoir répondu favorablement à cet appel à la réflexion, à la concertation et au dialogue sur la place de la photo au musée.

Jacqueline Eidelman, chef du département de la politique des publics à la direction générale des patrimoines, a ainsi organisé vendredi 4 mai une première réunion dans les locaux du ministère. Elle a réuni, outre les signataires de la lettre, environ vingt-cinq personnes représentant divers services du ministère ou institutions se trouvant sous sa tutelle : Réunion des musées nationaux (RMN), Centre des monuments nationaux (CMN), Centre de recherche et restauration des musées de France (C2RMF), service Études et Recherche du musée du Louvre, etc.

Un calendrier des discussions a pu être mis en place après que les principaux enjeux ont été soulevés : droit et possibilités d’interdiction de certaines pratiques par contrat, pratiques actuelles des visiteurs, mission de diffusion des collections, rôle dans la diffusion de la connaissance, gestion des flux dans le musée, importance de la médiation, travail quotidien du personnel de surveillance, sûreté des œuvres, etc. La présence de spécialistes à cette première réunion a déjà permis d’écarter quelques idées reçues comme le risque pour la conservation des peintures et sculptures, mais aussi d’appuyer sur la notion de confort de visite – à replacer dans un contexte plus large que la seule pratique de la photo. À chaque réunion pourront être présentes des personnes différentes, en fonction du sujet traité.

Un bénévole de Wikimédia France photographiant au musée des Augustins de Toulouse.
Photo par Léna, CC-by.
Peinture en arrière-plan : La Crèche, Marguerite Gérard

Le but final est la rédaction d’une charte du bon usage de la photographie au musée qui prenne en compte les pratiques des visiteurs, les possibilités légales, les conditions de travail du personnel et la conservation des œuvres. Wikimédia France souhaite vivement que l’ensemble des partenaires arrivent à un texte qui puisse être accepté et signé par tous, et fera tout son possible lors des discussions pour que ce soit le cas.

Il y a en effet beaucoup à faire dans les musées français pour éviter d’abandonner l’espace d’Internet aux musées américains, qui partagent déjà largement leurs ressources dans une approche de service public. Récemment, le Walters Art Museum de Baltimore a ainsi versé près de 20 000 photos librement réutilisables pour tous les usages (y compris commerciaux) sur Wikimedia Commons. Il en va de la survie de la culture française dans le monde numérique qui est le nôtre.

2 commentaires 30/04/2012

Wikipédia, une mine d’or pour les chercheurs en TALN

par Dominique Laurent, éditeur de logiciels de correction, que nous avons invité à exposer pour nos lecteurs l’usage qu’il a fait des articles de Wikipédia dans sa récente recherche et son analyse des fautes de français.

Auteur de l’ouvrage Les Vraies Difficultés du français au XXIe siècle, je me suis appuyé pour ce travail sur l’étude de Wikipédia, à travers une comparaison des versions de chacune des pages, cette comparaison permettant d’extraire au final plus de trois millions de fautes d’orthographe et de grammaire. Au-delà de cet ouvrage (voir préface et table des matières) et de mon travail quotidien de développement de logiciels de correction de la langue française (Cordial, dans ses différentes versions), je voudrais ici tenter de montrer en quoi Wikipédia est une mine d’or pour la recherche en traitement automatique du langage naturel (TALN), pour la langue française comme pour les autres langues.

Les pages de Wikipédia comme corpus

Nous utilisons, et de nombreux chercheurs utilisent, l’ensemble des pages de Wikipédia comme corpus. Pour ce qui nous concerne, sur un corpus global de 22 milliards de caractères, l’encyclopédie (dans sa version de novembre 2011) représente 13,4 % de la totalité de nos corpus. Le corpus Wikipédia a ses spécificités, en particulier la proportion relativement importante de noms propres (trois par phrase en moyenne) et de données chiffrées ou de dates. Il n’est pas dépourvu de fautes mais offre tout de même un bon niveau orthographique, comparable à celui des corpus journalistiques et sensiblement supérieur à celui des corpus Web (hors Wikipédia), sans comparaison avec ceux issus de forums de discussion.
Les corpus (certains préconisent le pluriel latin corpora) sont le pain quotidien des chercheurs en TALN. Ils permettent de tester des hypothèses, de mesurer la fréquence des mots et des phénomènes linguistiques (apostrophes, anaphores, métaphores, etc.). Leur mise à jour et leur étude comparée permettent d’évaluer les vocabulaires spécifiques à un domaine ou à une époque. Le corpus Wikipédia offre, au surplus, un accès libre, ce qui n’est pas le cas de la plupart des autres corpus qui ne peuvent être utilisés, même à des fins de recherche, sans accord des auteurs ou des ayants droit, sauf lorsque le délai de copyright a expiré, les textes ne pouvant alors représenter l’état de la langue actuelle.

L’historique de Wikipédia comme corpus

Nous avons massivement utilisé le dump complet de Wikipédia pour l’extraction des fautes et de leurs corrections. Ce corpus occupait fin 2011 plus de 900 gigaoctets, une fois décompressé, et, même dégagé des pages de discussion, des pages utilitaires ou d’homonymie ainsi que des traductions et catégories, inutiles pour notre travail, l’ensemble reste très volumineux, certaines pages ayant plusieurs milliers de versions. Seule l’extraction des corrections nous a intéressés mais de nombreux traitements sont imaginables à partir de cette base très précieuse. Même sur les corrections, on pourrait imaginer de relever le délai entre la faute et sa correction ou (probablement plus significatif) le nombre de versions entre la faute et sa correction. On pourrait également comparer l’identifiant des auteurs de fautes et des auteurs de corrections qui, lorsqu’ils sont identiques, permettent de penser que ces fautes sont plutôt des fautes de frappe que des fautes de méconnaissance de la langue.
L’historique peut également être utilisé pour détecter des paraphrases (voir par exemple l’article et la présentation de Delphine Bernhard, du laboratoire Limsi, à CBA 2010 : http://stel.ub.edu/cba2010/slides2010/paraphrasing/afternoon/dutrey.pdf). D’autres pistes ont été ouvertes par d’autres chercheurs, entre autres les précurseurs Rani Nelken et Elif Yamangil de l’université de Harvard (http://www.eecs.harvard.edu/~elif/pubs/eggcorn.pdf).

Autres ressources de Wikipédia

Les données encyclopédiques de Wikipédia peuvent également être utilisées pour constituer des bases de données et améliorer l’analyse des textes, en fournissant des informations pragmatiques aidant à leur compréhension. C’est l’objet du projet DBpedia (Universités de Leipzig et Berlin) mais de nombreuses équipes de recherche ont extrait à partir de la Wikipédia anglophone ou à partir de versions dans d’autres langues des données sur les personnes, les lieux, les événements ou même sur les animaux et les plantes. Pour ce qui concerne les noms de lieux et la géolocalisation, Wikipédia est toutefois moins utilisée que la base Geonames.
Le Wiktionnaire est un projet distinct de Wikipédia mais il est également de plus en plus utilisé par les chercheurs, même si la lexicographie demande une rigueur qui est parfois absente de certaines contributions (voir l’article de G. Sérasset, J. Goulian et D. Schwab : « Extraire un réseau lexical des wiktionnaires multilingues », TALN 2011, Montpellier, 27 juin-1er juillet 2011).

Quelques aléas de Wikipédia

L’encyclopédie collaborative n’a pas été conçue pour les chercheurs en traitement du langage. Il est d’ailleurs amusant de constater que l’autre ressource principalement utilisée en TALN, à savoir WordNet, avait été conçue plutôt dans un objectif d’analyse psychologique et cognitive que pour un usage linguistique.
Tout chercheur utilisant Wikipédia est rapidement confronté aux limitations de ce corpus. L’exemple le plus frappant est l’absence de catégorie homme/femme. Cette absence de différenciation par sexe est une limitation importante à l’utilisation de Wikipédia en tant que ressource lexicologique, du moins pour ce qui est des noms de personnes. De même l’absence de catégorisation grammaticale pour les noms propres (pour les noms communs, le Wiktionnaire n’a pas ce défaut) est une autre limite.
Pour avoir essayé d’utiliser les catégories de Wikipédia pour replacer les noms propres dans notre vaste réseau sémantique, je peux également émettre des réserves dans ce domaine. Les catégories comportent en effet trop souvent des mélanges d’ensembles et de parties (hyperonymes et hyponymes), certaines catégories font parfois double emploi avec d’autres catégories, et sont surtout mal renseignées par de nombreux contributeurs. Les subdivisions par pays sont souvent source de doublettes. Ainsi 61 sociétés américaines figurent dans la catégorie « éditeur de logiciel américain » mais un plus grand nombre d’autres figurent dans la catégorie « éditeur de logiciel » sans précision de pays. Peut-être faudrait-il fournir aux contributeurs des outils permettant de mieux repérer les catégories ou peut-être faudrait-il développer des outils de remise à niveau des catégories ?

Wikipédia aide les chercheurs et ceux-ci aident Wikipédia

Je n’aborderai ici que les contributions de notre société à Wikipédia, manquant d’informations sur les contributions éventuelles d’autres chercheurs. Ayant confronté nos données sur les noms propres à celles de Wikipédia, cette confrontation nous a permis naturellement de découvrir des erreurs dans nos données mais également dans celles de Wikipédia, par exemple des personnes ayant une date de décès inférieure ou égale à leur date de naissance (Luc Desnoyers par exemple, correction du 23 avril 2010, ou Johnny Williams indiqué comme né en 1882 au lieu de 1982, etc.). Bien qu’ils ne soient pas les auteurs des pages sur notre société ou nos produits, plusieurs salariés sont par ailleurs contributeurs, mais c’est une autre histoire !

Dominique Laurent

Aucun commentaire 10/04/2012

La Fondation Konrad Adenauer partage des images d’archive sur Wikimedia Commons

Afin de faire mieux connaître la richesse des projets Wikimédia, nous nous proposons de publier régulièrement des billets décrivant certains projets, certains partenariats ou simplement de « belles histoires » (success stories) reliés aux projets Wikimédia.
Prenant un peu de distance par rapport à l’actualité, cette série de billets se veut avant tout explicative et exemplaire de ce que l’on peut trouver sur les projets Wikimédia.
Si vous avez vous-même repéré ou mis en œuvre des actions de ce type, n’hésitez pas à nous en faire part !

°°°°°°

La Fondation Konrad Adenauer (Konrad-Adenauer-Stiftung), fondation politique allemande, a partagé plus de cent images extraites de ses fonds sur Wikimedia Commons. Les fichiers y sont publiés sous les termes de la licence libre Creative Commons Paternité Partage à l’Identique, permettant une réutilisation par tous de ces œuvres.

Konrad Adenauer et Ludwig Erhard

Konrad Adenauer et Ludwig Erhard lors de la convention de la CDU en mars 1965.
(CDU, CC-BY-SA)

Le fonds partagé comprend essentiellement des photographies d’archive. Celles-ci montrent principalement le chancelier d’Allemagne Konrad Adenauer, accompagné d’autres personnalités politiques des années 1960, telles le vice-président du Bundestag Kai-Uwe von Hassel, le vice-chancelier Ludwig Erhard, le ministre-président Franz Meyers ou le ministre fédéral Rainer Barzel. Le fonds partagé inclut également des affiches des campagnes de la CDU de 1949 à 1965.

Cette initiative de la Fondation Konrad Adenauer n’est pas sans rappeler celle des Archives fédérales allemandes (Bundesarchiv), qui en 2008 avaient ouvert leurs fonds sur Wikimedia Commons. En effet, de tout ce corpus de plus de 80 000 fichiers, l’une des photographies les plus populaires était déjà le portrait de Konrad Adenauer, ainsi que ceux d’autres personnalités allemandes : politiques comme Willy Brandt ou Walter Scheel, scientifiques tels Otto Hahn ou Werner Heisenberg, littéraires comme Oswald Spengler ou Heinrich Böll. Mais ce sont également des images des archives allemandes qui illustrent les biographies de personnalités politiques et historiques françaises, comme Georges Pompidou, Charles de Gaulle, Robert Schuman, ou même René Lacoste.

Toutes les images partagées par la Fondation sont disponibles sur Wikimedia Commons.

un commentaire 28/03/2012

Osez corriger des manuscrits sur Wikisource avec les Archives départementales des Alpes-Maritimes !

Une expérience intéressante se déroule depuis le mois de janvier sur Wikisource : une petite équipe d’apprentis paléographes, sous la direction d’Hélène Cavalié, directrice adjointe des Archives départementales des Alpes-Maritimes, œuvre à mettre en ligne et transcrire des manuscrits du XVIIIe siècle.

L’idée est venue d’un fonds de visites pastorales conservé aux archives, qui mérite amplement d’être valorisé tant il est riche d’informations et de descriptions sur les villages et la vie des diocèses de Vence et Grasse. Comment faire efficacement et intelligemment cette transcription ? Eh bien… sur Wikisource !

Exemple de manuscrit des Archives des Alpes-Maritimes sur Wikisource

Wikisource est la « bibliothèque libre » des projets Wikimédia. Elle a pour ambition de proposer des textes dans le domaine public ou publiés sous licence libre. Les livres sont numérisés, OCRisés et ensuite corrigés manuellement et collaborativement afin d’en supprimer les coquilles et erreurs de mise en page. Au final, le lecteur a à sa disposition un texte librement diffusable et interrogeable notamment en recherche plein-texte, ce qui est précieux pour quantité d’usages. Wikisource existe en une soixantaine de langues différentes et la version francophone compte à ce jour plus de 80 000 textes disponibles, corrigés, en cours de correction ou non encore corrigés.

Les Archives départementales des Alpes-Maritimes sont les premières en France à utiliser Wikisource comme outil et plate-forme de publication et valorisation de leurs archives manuscrites. Le travail avance au rythme des corrections, quelques contributeurs aguerris de Wikisource gardant un œil bienveillant et aidant sur les contributions des nouveaux arrivants. Wikimédia France a apporté une aide au démarrage, pour conseiller techniquement et présenter le projet à la communauté des contributeurs de Wikisource.

On trouvera sur la Tribune des Archives, qui présente un premier « retour d’expérience » très positif, toutes les clés pour que d’autres archives se lancent sur Wikisource, et on ne peut qu’espérer que ce premier projet en appelle d’autres ! Que les amateurs de manuscrits se lancent sur ce beau projet, et qu’ils rejoignent les amateurs d’imprimés pour offrir toujours plus de textes libres et aisément réutilisables.

Comme pour tous les projets Wikimédia, la règle c’est : n’hésitez pas !

Liens utiles

par Adrienne Alix
Categories: Projets Wikimedia, Wikisource