Archive

Articles taggués ‘billet invité’
un commentaire 01/07/2014

Wikipédia à l’université : quand les étudiants deviennent contributeurs

(Ce billet est un retour d’expérience rédigé par Sylvain Léauthier, webmaster éditorial & chargé des réseaux sociaux à l’Université Catholique de Lyon, et coordinateur du projet pédagogique avec le Musée des Beaux-Arts de Lyon. Il a été initialement publié sur son blog personnel et repris avec autorisation)

Certains enseignants disent que « les étudiants utilisent trop wikipédia » ; mais si on cherchait plutôt à faire en sorte qu’ils l’utilisent mieux ?
Et pour apprendre à mieux l’utiliser, quoi de mieux qu’apprendre aux étudiants à devenir contributeurs ?
Tel est le pari initié cette année par la licence de lettres modernes de l’Université Catholique de Lyon, en partenariat avec le Musée des beaux-arts de Lyon et Wikimédia France.
Objectif : faire que les étudiants en première année de licence lettres modernes écrivent les articles de 22 œuvres sélectionnées conjointement avec le musée.
Au menu : beaucoup de peintures (Jordaens, Delacroix, Janmot…), un peu de sculpture et une pincée de céramique.
Retour d’expérience.

Du temps…et des encadrants

Premier point qui m’a semblé essentiel : il a fallu du temps, et un certain nombre d’acteurs pour mener à bien ce projet.
Du temps d’abord pour organiser le projet, car entre les premières réunions avec les responsables du musée et la mise en ligne des articles la semaine dernière, il s’est écoulé un an et demi.
Du temps également pour les étudiants, afin qu’ils puissent mener à bien les différentes étapes du projet :

  • faire les recherches bibliographiques au Musée (et au dehors)
  • rédiger un dossier sur l’œuvre
  • apprendre l’utilisation de Wikipédia (3h de TD) et intégrer la synthèse de leur dossier sur les brouillons wikipédia (3h de TD + travail “à la maison”).

Ici, le fait de travailler en amont sur le fond (dossier) avant de commencer à travailler sur wikipédia est à mon avis essentiel.
Toutes ces phases étaient encadrées par différents acteurs : conservateurs du musée et un enseignant en histoire de l’art pour la recherche bibliographique et la validation du contenu, wikipédiens, webmaster du musée et moi-même pour l’intégration du contenu (textes et photos) sur wikipédia.
Il faut aussi souligner que les étudiants ont été évalués sur leur dossier et sur leur article wikipédia (deux notes indépendantes).
À l’heure où les “dispositifs éclairs” de médiation culturelle sont à la mode (Muséomix), cette expérience montre qu’il faut parfois du temps pour aboutir à des réalisations satisfaisantes.

Apprendre wikipédia : style et syntaxe

J’ai donc pris en charge les étudiants à un stade où ils avaient déjà rédigé leur dossier, références bibliographiques y compris.
Après une présentation de wikipédia (1 heure), les étudiants ont très rapidement débuté la contribution via notre page projet, après s’être crée un compte (un compte par étudiant).
Sur le style, il a fallu orienter les étudiants afin qu’ils adoptent un ton factuel, non littéraire (ce qui peut être difficile pour des étudiants en lettres modernes) et non scolaire (éviter les tournures comme “Nous avons choisi ce sujet car…”)
Sur la syntaxe, cela fut un peu plus long car elle nécessite un apprentissage : certains étudiants ont trouvé cette syntaxe complexe, d’autres non ; nous avions eu la chance, grâce aux wikipédiens locaux, d’avoir à disposition le guide de contribution en version papier, support qui a bien aidé les étudiants.

En fournissant une sélection de ressources clés, j’ai insisté sur une démarche empirique, en leur recommandant de regarder le code des autres articles d’œuvres et en s’exerçant.
Les étudiants ont ainsi rapidement compris le fonctionnement des sections, liens internes, infobox et portails, ce fut plus difficile pour les citations.
Les photos des œuvres ont été upoladées par Stéphane Degroisse, webmestre et chargé des nouveaux médias, et les wikipédiens, notamment pour des raisons de droit d’auteur.

La syntaxe wikipédia, frein ou exhausteur de motivation ?

Par choix pédagogique mais également parce que l’éditeur WYSIWYG (bouton “modifier”) n’était pas encore activé sur les pages projets que nous utilisions, les étudiants ont contribué avec l’éditeur source (bouton “modifier le code”), ce qui supposait l’apprentissage de la fameuse syntaxe wikipédia.
Même si ce mode de contribution peut être un frein pour des contributeurs occasionnels, car cela nécessite un savoir-faire supplémentaire à acquérir, j’ai au contraire trouvé intéressant de faire apprendre aux étudiants les rudiments de cette syntaxe.
D’abord dans le but d’apprendre un nouveau langage, mais aussi pour des raisons de motivation : les développeurs et intégrateurs le savent bien : il y a un aspect tout à fait grisant à travailler sur une interface que seul le créateur voit et connaît puis, d’un seul coup, voir le résultat que le public verra. Ce passage de l’atelier à la scène (ou à la salle d’exposition), de la maquette à l’objet est sans doute une source motivationnelle supplémentaire.

Chercher le sens, et non l’erreur

Certaines personnes font parfois remarquer qu’il y a des fautes dans certains articles wikipédia.
Mais plutôt que de dénoncer les erreurs (il y a sans doute une part de snobisme à dire que l’on trouve des fautes sur un support devenu une référence), et si on les corrigeait ?
Il est sans doute nécessaire aussi de relativiser l’importance des erreurs : à l’heure du fact-checking et de l’omniprésence (qui devient croyance ?) de la “data”, on oublie souvent que le sens est parfois plus important que des données.
J’avais particulièrement apprécié la remarque de Rémi Mathis, président de Wikimédia France, à ce sujet, dans une interview accordée à Lyoncapitale (1) :

Une erreur ne veut tout simplement rien dire. Dans les articles de sciences humaines ou historiques, vous pouvez avoir des sujets qui sont complètement nuls et n’avoir aucune erreur factuelle. Alors que des articles qui posent les bons enjeux, mais qui vous disent que tel événement s’est passé en 1611 et non pas en 1612, c’est une erreur, mais on s’en fiche. Ce qui est important, c’est le déroulé, le sens.

Cette idée s’est confirmée dans ce projet : c’est l’analyse d’une œuvre, la description de son contexte de création et la qualité des sources qui font la qualité d’un article ; les coquilles, erreurs d’orthographe n’altéreront pas le sens de l’article et seront d’ailleurs rapidement corrigés par un(e) wikipédien(ne).

Évaluer le contenu plutôt que l’auteur

En parlant avec lui de notre projet, un enseignant me demandait si les articles publiés porteraient la mention qu’ils ont été créés dans un cadre universitaire.
Une question qui soulève un point central du fonctionnement de l’encyclopédie collaborative : contrairement aux encyclopédies traditionnelles et aux publications universitaires dans lesquelles l’auteur ou le support font la crédibilité du contenu, c’est au contraire la somme des contributions qui fait la qualité d’un article sur wikipédia.
Je trouve très intéressant d’apprendre aux étudiants que la crédibilité d’un contenu n’existe pas par défaut et qu’elle n’est pas binaire (l’idée qu’il y a des experts et des amateurs, de bons auteurs et de mauvais, des supports de références et des médiocres) mais qu’elle est plus subtile (un expert peut rédiger de bons et de mauvais articles, sur un même support peuvent co-exister des contenus plus ou moins qualitatifs, un même article peut avoir des contenus de qualité variables) et que l’enjeu (sur wikipédia mais comme sur toute ressource qu’elle soit en ligne ou non, participative ou non) est bien d’acquérir la capacité à évaluer, pour chaque contenu, sa qualité.
Sur wikipédia, l’historique des contributions d’un article, sa bibliographie et ses sources constituent des indicateurs intéressants.

L’étudiant contributeur : médiateur, chercheur ?

Les travaux d’étudiants ne sont généralement lus que par une seule personne : l’enseignant correcteur. Dans cette expérience, leurs travaux seront lus par un très grand nombre de personnes, et certainement sur une longue période.
Cette responsabilité, permise par l’audience de wikipédia, est évidemment une source de motivation essentielle pour les étudiants (la “perception de valeur” décrite par Rolland Viau (2) ).
Pour autant, elle n’est pas non plus anxiogène et bloquante pour les étudiants comme pour les encadrants, car les articles sont modifiables à tout moment.
En faisant sortir le travail de l’étudiant du cadre du cours et du périmètre de l’université, l’étudiant devient un agent de médiation (culturelle, dans ce projet), avec peut-être également une posture de chercheur, puisque l’étudiant a créé et publié de la connaissance, même si celle-ci est souvent la synthèse d’autres publications.

Contribuer à wikipédia : un don de soi ?

La dimension du don est donc également présente dans l’action de publier son travail sur wikipédia, puisque l’ensemble de son contenu est sous licence libre.
Cette notion de désappropriation du travail effectué est à mon avis très intéressante.
La notion de partage, si souvent galvaudée sur les réseaux sociaux, prend ici tout son sens.
J’ai d’ailleurs remarqué que tous les acteurs du projet se remerciaient à l’issue d’une rencontre : étudiants, wikipédiens, enseignants, conservateurs, webmestres…
Remercier l’autre est toujours un bon signe : cela signifie qu’on pense qu’il nous a aidé, qu’il nous a apporté.
Quand tout le monde se remercie, cela signifie sans doute que chaque acteur du projet a le sentiment d’avoir reçu quelque-chose.
J’en profite donc une nouvelle fois pour remercier tous les acteurs de ce beau projet.

Sylvain Léauthier

Voir la page du projet:

https://fr.wikipedia.org/wiki/Projet:Projet_Lettres_Modernes_UCLy_%26_Mus%C3%A9e_des_Beaux-Arts

Références

(1) Lyon capitale, Wikipédia n’est pas un encyclopédie, Interview de Remi Mathis, Président de Wikimedia France – 1er juin 2013
https://www.lyoncapitale.fr/Journal/France-monde/Actualite/Dossiers/Wikipedia-a-la-loupe/Wikipedia-n-est-pas-une-encyclopedie

(2) Conférence de Rolland Viau sur le motivation en octobre 2013 à l’université Catholique de Lyon.
http://www.youtube.com/watch?v=30h3q-jai9I

Ressources

3 commentaires 30/04/2012

Wikipédia, une mine d’or pour les chercheurs en TALN

par Dominique Laurent, éditeur de logiciels de correction, que nous avons invité à exposer pour nos lecteurs l’usage qu’il a fait des articles de Wikipédia dans sa récente recherche et son analyse des fautes de français.

Auteur de l’ouvrage Les Vraies Difficultés du français au XXIe siècle, je me suis appuyé pour ce travail sur l’étude de Wikipédia, à travers une comparaison des versions de chacune des pages, cette comparaison permettant d’extraire au final plus de trois millions de fautes d’orthographe et de grammaire. Au-delà de cet ouvrage (voir préface et table des matières) et de mon travail quotidien de développement de logiciels de correction de la langue française (Cordial, dans ses différentes versions), je voudrais ici tenter de montrer en quoi Wikipédia est une mine d’or pour la recherche en traitement automatique du langage naturel (TALN), pour la langue française comme pour les autres langues.

Les pages de Wikipédia comme corpus

Nous utilisons, et de nombreux chercheurs utilisent, l’ensemble des pages de Wikipédia comme corpus. Pour ce qui nous concerne, sur un corpus global de 22 milliards de caractères, l’encyclopédie (dans sa version de novembre 2011) représente 13,4 % de la totalité de nos corpus. Le corpus Wikipédia a ses spécificités, en particulier la proportion relativement importante de noms propres (trois par phrase en moyenne) et de données chiffrées ou de dates. Il n’est pas dépourvu de fautes mais offre tout de même un bon niveau orthographique, comparable à celui des corpus journalistiques et sensiblement supérieur à celui des corpus Web (hors Wikipédia), sans comparaison avec ceux issus de forums de discussion.
Les corpus (certains préconisent le pluriel latin corpora) sont le pain quotidien des chercheurs en TALN. Ils permettent de tester des hypothèses, de mesurer la fréquence des mots et des phénomènes linguistiques (apostrophes, anaphores, métaphores, etc.). Leur mise à jour et leur étude comparée permettent d’évaluer les vocabulaires spécifiques à un domaine ou à une époque. Le corpus Wikipédia offre, au surplus, un accès libre, ce qui n’est pas le cas de la plupart des autres corpus qui ne peuvent être utilisés, même à des fins de recherche, sans accord des auteurs ou des ayants droit, sauf lorsque le délai de copyright a expiré, les textes ne pouvant alors représenter l’état de la langue actuelle.

L’historique de Wikipédia comme corpus

Nous avons massivement utilisé le dump complet de Wikipédia pour l’extraction des fautes et de leurs corrections. Ce corpus occupait fin 2011 plus de 900 gigaoctets, une fois décompressé, et, même dégagé des pages de discussion, des pages utilitaires ou d’homonymie ainsi que des traductions et catégories, inutiles pour notre travail, l’ensemble reste très volumineux, certaines pages ayant plusieurs milliers de versions. Seule l’extraction des corrections nous a intéressés mais de nombreux traitements sont imaginables à partir de cette base très précieuse. Même sur les corrections, on pourrait imaginer de relever le délai entre la faute et sa correction ou (probablement plus significatif) le nombre de versions entre la faute et sa correction. On pourrait également comparer l’identifiant des auteurs de fautes et des auteurs de corrections qui, lorsqu’ils sont identiques, permettent de penser que ces fautes sont plutôt des fautes de frappe que des fautes de méconnaissance de la langue.
L’historique peut également être utilisé pour détecter des paraphrases (voir par exemple l’article et la présentation de Delphine Bernhard, du laboratoire Limsi, à CBA 2010 : http://stel.ub.edu/cba2010/slides2010/paraphrasing/afternoon/dutrey.pdf). D’autres pistes ont été ouvertes par d’autres chercheurs, entre autres les précurseurs Rani Nelken et Elif Yamangil de l’université de Harvard (http://www.eecs.harvard.edu/~elif/pubs/eggcorn.pdf).

Autres ressources de Wikipédia

Les données encyclopédiques de Wikipédia peuvent également être utilisées pour constituer des bases de données et améliorer l’analyse des textes, en fournissant des informations pragmatiques aidant à leur compréhension. C’est l’objet du projet DBpedia (Universités de Leipzig et Berlin) mais de nombreuses équipes de recherche ont extrait à partir de la Wikipédia anglophone ou à partir de versions dans d’autres langues des données sur les personnes, les lieux, les événements ou même sur les animaux et les plantes. Pour ce qui concerne les noms de lieux et la géolocalisation, Wikipédia est toutefois moins utilisée que la base Geonames.
Le Wiktionnaire est un projet distinct de Wikipédia mais il est également de plus en plus utilisé par les chercheurs, même si la lexicographie demande une rigueur qui est parfois absente de certaines contributions (voir l’article de G. Sérasset, J. Goulian et D. Schwab : « Extraire un réseau lexical des wiktionnaires multilingues », TALN 2011, Montpellier, 27 juin-1er juillet 2011).

Quelques aléas de Wikipédia

L’encyclopédie collaborative n’a pas été conçue pour les chercheurs en traitement du langage. Il est d’ailleurs amusant de constater que l’autre ressource principalement utilisée en TALN, à savoir WordNet, avait été conçue plutôt dans un objectif d’analyse psychologique et cognitive que pour un usage linguistique.
Tout chercheur utilisant Wikipédia est rapidement confronté aux limitations de ce corpus. L’exemple le plus frappant est l’absence de catégorie homme/femme. Cette absence de différenciation par sexe est une limitation importante à l’utilisation de Wikipédia en tant que ressource lexicologique, du moins pour ce qui est des noms de personnes. De même l’absence de catégorisation grammaticale pour les noms propres (pour les noms communs, le Wiktionnaire n’a pas ce défaut) est une autre limite.
Pour avoir essayé d’utiliser les catégories de Wikipédia pour replacer les noms propres dans notre vaste réseau sémantique, je peux également émettre des réserves dans ce domaine. Les catégories comportent en effet trop souvent des mélanges d’ensembles et de parties (hyperonymes et hyponymes), certaines catégories font parfois double emploi avec d’autres catégories, et sont surtout mal renseignées par de nombreux contributeurs. Les subdivisions par pays sont souvent source de doublettes. Ainsi 61 sociétés américaines figurent dans la catégorie « éditeur de logiciel américain » mais un plus grand nombre d’autres figurent dans la catégorie « éditeur de logiciel » sans précision de pays. Peut-être faudrait-il fournir aux contributeurs des outils permettant de mieux repérer les catégories ou peut-être faudrait-il développer des outils de remise à niveau des catégories ?

Wikipédia aide les chercheurs et ceux-ci aident Wikipédia

Je n’aborderai ici que les contributions de notre société à Wikipédia, manquant d’informations sur les contributions éventuelles d’autres chercheurs. Ayant confronté nos données sur les noms propres à celles de Wikipédia, cette confrontation nous a permis naturellement de découvrir des erreurs dans nos données mais également dans celles de Wikipédia, par exemple des personnes ayant une date de décès inférieure ou égale à leur date de naissance (Luc Desnoyers par exemple, correction du 23 avril 2010, ou Johnny Williams indiqué comme né en 1882 au lieu de 1982, etc.). Bien qu’ils ne soient pas les auteurs des pages sur notre société ou nos produits, plusieurs salariés sont par ailleurs contributeurs, mais c’est une autre histoire !

Dominique Laurent

Aucun commentaire 11/04/2011

François Bon – sa vision de Wikipédia

Wikimédia France suit avec intérêt les réflexions et expériences innovantes dans le domaine de la culture numérique. Nous sommes donc honorés de publier ici ce texte de François Bon, écrivain et éditeur, fondateur de publie.net, déjà publié sur son blog le tiers livre, à l’occasion de la parution de Vie et mort de Tina l’exilée de Patrick Deville.

Qu’est-ce qu’on n’a pas entendu sur Wikipédia ?

Parce que nos encyclopédies étaient depuis l’enfance nos possessions les plus précieuses, familiales ou collectives. Chez Borges, l’article manquant dans une réimpression du tome Tlön-Uqbar de la Britannica génère l’existence de tout un peuple et son énigme. Et voilà qu’on prend le risque que tout s’écroule. Où était le scandale ? Ce que validait le processus de fabrication était confié à la foule des contributeurs, et accessible à tous, sans achat préalable. Il y a eu des histoires, pages détournées, attaques diffamatoires discrètement glissées, imprécisions dont il était facile de se moquer – mais quelle proportion par rapport au surgissement qui semble désormais accompagner la totalité de nos curiosités ? Wikipédia apprendrait progressivement à se doter d’une mécanique parallèle de validation : traçage des contributeurs, pertinence des révisions.

Mais pour le mécanisme même, pas de retour en arrière possible.

Et nous-mêmes, dans nos permanentes recherches, trions du premier coup d’œil la référence Wikipédia des ressources éventuellement plus spécialisées que nous recherchons. Mais la référence Wikipédia, on s’en servira comme synthèse, et de plus en plus comme répertoire de liens, réouvrant vers le web à un autre niveau que le moteur de recherche généraliste. Ainsi, l’encyclopédie ouverte, anonyme et gratuite a trouvé sa permanence et sa pertinence dans nos usages quotidiens, privés ou professionnels.

Wikipédia est une sorte de compagnon de proximité : non pas forcément pour les choses les plus pointues (comme on plaisantait autrefois du Monde que nous lisions tous, disant que c’était le meilleur journal, sauf en ce qui concernait la discipline de chacun). Là encore, des disparités, selon ce que les chercheurs en saisissent : il m’arrive des explorations complètement stupéfaites concernant des points scientifiques ou techniques. Je m’en sers pour retrouver instantanément un point de bibliographie, date de parution de tel livre de Duras, même si ensuite je prolonge ailleurs mes recherches. Les autres sources seraient à un niveau de validation plus fiable ? Je sais bien que là où elles s’élaborent, dans les maisons d’édition notamment, c’est Wikipédia et Google qui sont ouverts sur les ordinateurs.

Comme il était magique, autrefois, notre Petit Larousse, d’aller dans la page des noms propres et de trouver, même pour son propre village, après l’indication de la sous-préfecture dont nous dépendions, le nombre précis des habitants : on habitait nous-mêmes un peu le dictionnaire. Wikipédia est un outil spatial aussi puissant dans son genre que Google Earth dans le sien. Chaque lieu a son histoire, son bassin de liens, et une relation d’intimité aux contributeurs encore plus marquée que pour les points techniques ou culturels. J’ai affaire à une ville ou un lieu dans mes écritures personnelles, même une toute petite ville loin à l’étranger, et j’irai voir l’article Wikipédia.

Je ne suis jamais intervenu dans la page Wikipédia qui me concerne, je trouverais ça indiscret, vaguement obscène même. Quand on m’a communiqué les 4 ou 10 lignes que me valait mon travail dans l’Universalis ou le Quid, j’étais content de les transmettre à ma maman, ça vaut toujours mieux que vos propres livres pour votre réputation, mais l’article Wikipédia est bien plus renseigné. À voir comment y sont mises en avant mes activités dans la région ouest, j’imagine que le ou les contributeurs (pas cherché à déplier les liens) sont arrivés par là. Posant récemment cette question à un ami enseignant les bases informatiques dans une fac de lettres et langues, j’ai découvert qu’un des exercices obligatoires, et un moment fort du cours, que ce soit langues ou lettres, c’était de proposer collectivement aux étudiants (et les évaluer en conséquence) une contribution, ajout ou développement, à Wikipédia, en rapport avec le thème de leur section ou études. La prise en charge anonyme, large et collective de la validation même de Wikipédia, comme propriété commune, s’établit donc selon des processus vérifiables.

Un autre déplacement, en lui-même peu signifiant, mais qui me semble déterminant, c’est la pluralité des langues. Si nous avions accès aux dictionnaires et encyclopédies, à la maison, à l’école ou en bibliothèque, et quand bien même on trouvait (le Grand Larousse du XIXe siècle se lit comme un roman, tout rempli de crimes et d’horreurs) d’infinis prolongements à nos requêtes, c’était toujours dans notre propre langue. Wikipédia propose de lui-même l’extension à une recherche multilingue (Global Wikipedia), et le savoir intuitif de comment est construit un article, fait qu’on atterrit souplement dans la langue étrangère, et qu’on s’y reconnaît presque comme chez soi. On apprend, pour une information qui nous concerne de près, que la langue support compte peut-être moins que cette proximité même. Je ne parle ni ne lis l’espagnol, mais j’arrive parfaitement à me débrouiller d’un article Wikipédia en espagnol, si ma requête concerne un lieu ou un personnage d’Amérique du Sud.

Gardons-nous nos colères, nos impatiences ? Oui, bien sûr. Mais nous savons d’avance la réponse qui les désamorce : ah bon, l’article Wikipédia en français sur Julio Cortázar n’est pas à la hauteur de l’importance, la complexité, la richesse de cet écrivain ? Eh bien, que ne le complètes-tu toi-même… C’est une leçon du web que nous avons en permanence à réapprendre : le lire et l’écrire vont ensemble, et c’est ce qui dérange même les grandes figures artificielles de l’écrivain, du copyright et du droit d’auteur, de la publication – à nous de l’investir, humblement, anonymement, via notre mot de passe de contributeur.

Finalement, l’écran disparaît. Il est dans toutes les strates de notre relation au monde, de la recette de cuisine au voyage à préparer, du livre qu’on lit aux horaires du bus ou du train qu’on doit prendre. Nous utilisons d’ailleurs, téléphone ou tablette ou notre ordinateur fixe, une suite plurielle d’écran – depuis le musée, une interrogation sur une date, un nom, et l’article Wikipédia nous rejoint sans qu’on ait à attendre, interagit avec ce que nous regardons en temps et situation réels. En disparaissant, l’écran laisse une suite de strates transparentes : le moteur de recherche en est une, le dictionnaire Littré dans mon disque dur une autre, les ressources que je sais déposées dans mon disque dur (y compris les archives e-mails, les photographies) encore une autre. Wikipédia s’est imposé pour nous tous comme une de ces couches, familières, fines, mobile, plus ou moins pertinente qu’est-ce que cela fait, on la traverse nécessairement.

Questions qui se démultiplient pour un auteur : les textes proposés sur Wikisource sont extrêmement précis, puisque d’une part chaque contributeur a bichonné le texte proposé, d’autre part chacun peut apporter ses corrections, qu’on compare aux numérisations du Projet Gutenberg ou de Gallica pour voir. Et que Gallica (la Bibliothèque nationale de France) intègre cette collaboration, quelle bonne nouvelle. En même temps, ce ne sont pas des textes qui bénéficient du processus d’éditorialisation que nous apprenons à mettre en place : structuration de la table des matières oui, mais insécables, ergonomie de lecture, facilité à transporter ces textes sur des supports comme l’iPad, ce n’est pas le rôle des contributeurs de Wikisource. Pourtant, ces textes appellent cette éditorialisation pour que lire devienne vraiment plaisir, et pas consultation comme on le fait des articles. Et pour nous, auteurs, la question n’est pas principalement celle de la gratuité des ressources : nous proposons sur nos sites des ressources gratuites, elles s’associent avec les ressources rémunérées (livres numériques inclus), nous aident à nous positionner dans la vie sociale pour faire de notre écriture un métier (via autres commandes, lectures publiques etc.). Plutôt une question sur l’identité numérique : un texte que nous déposerions sur Wikisource ne séparerait-il pas nos visiteurs de notre site ? En même temps, j’ai l’impression que cette frontière devient fatalement poreuse : il n’y a pas un web de création, débat et polémique, complètement séparé d’un web de ressources validées et pérennes, les deux sont appelés de plus en plus à interférer.

Voilà ce qui m’a traversé la tête, quand Patrick Deville m’a proposé Vie et mort de sainte Tina l’exilée. Les romans de Patrick Deville, chez Minuit puis au Seuil, ont un soubassement commun : l’enquête, le voyage. C’était déjà chez Hérodote, très vieille fonction originelle de la littérature. Patrick Deville a trouvé depuis quelques années son point d’assemblage : d’un livre à l’autre, il remonte vers l’est, et ses romans vont ainsi recouvrir la terre. Pour chacun, l’Afrique noire l’an passé, le Cambodge dans celui qui vient, l’enquête s’ancre dans le contemporain, mais soude les livres l’un à l’autre par ce passé où interfère en permanence, en n’importe quel point du monde, l’histoire mondiale.

Sous ce grand voyage de fictions tournant autour de la terre, pour chacune les personnages réels interfèrent avec la fiction, quand seule l’autonomie de la langue permet d’inventorier l’inconnu du monde. Ces personnages ont une résistance, le roman ne les épuise pas, on les retrouve parfois passant de l’un à l’autre.

Ainsi de Tina Modotti : italienne, son père exilé aux États-Unis, elle le rejoint et devient petite couturière anonyme dans le grand brassage de Los Angeles. Puis taillant les costumes pour les tournages d’Hollywood, puis figurante, puis modèle du peintre Richard Weston. Elle vit au Mexique, devient elle-même photographe, laisse Weston pour le peintre en pleine ascension qu’est Diego Rivera. Alors c’est l’Histoire avec majuscule que croise la vie de Tina, de Trotsky à Malcolm Lowry ou Dos Passos, des danseurs de tango aux sombres affidés de Staline, des dictatures chamboulées aux anarchistes nomades, tout se rejoint parfois en un lieu, une poignée de jours – et la vie de ceux-là brûle.

Lorsque j’ai avancé dans ma première lecture du texte de Patrick Deville, que la lecture numérique autorise ce jeu permanent, dans l’intérieur du livrel, entre le texte et le réel source, j’en étais immédiatement sûr. Qu’il s’agisse de Mata Hari, du Komintern, du café Sorocabana de Buenos-Aires ou du cimetière Panteon de los Dolores de Mexico, si nous aimons lire numérique c’est pour cet axiome : plus on propose de sortir d’un texte, plus on aura plaisir à y revenir. Après tout, les livres imprimés qui ont été pour nous les plus précieux sont ceux qui nous ont fait le plus rêver pendant leur lecture même.

Ce que je ne savais pas, c’est comment Wikipédia me proposerait pour ce texte bref (36 pages), un parfait miroir du monde. Choisir tour à tour des liens dans Wikipédia et dans le web : mais ces liens sont dans les articles Wikipédia, qui intervient non pas comme tour de contrôle, mais presque comme un outil de dispersion, et libre à chacun d’aller vers telle piste ou telle autre. Le texte littéraire source alors troué de liens soulignés en bleu ? L’hypertexte ne doit pas abîmer la surface du texte, elle est un tissu aussi précieux que ces tissages des femmes mexicaines d’Oaxaca. Dans la version PDF, ils sont invisibles. Sur votre ordinateur, vous saurez le lien, sous le nom propre ou le mot technique, parce que le curseur de la souris deviendra une main, et sur votre tablette, une discrète inflexion de couleur. Mais avec 140 liens sous les 36 pages, c’est presque doubler le texte, comme un tissu (qu’on m’excuse de la redondance, les deux mots ont même étymologie), d’une nappe transparente, qui diffracte le texte vers le réel, avec chemin garanti de retour, au point même de lecture où vous étiez.

Il me semble qu’on ouvre ainsi à l’écriture non pas une technique (l’hypertexte, ce n’est pas d’aujourd’hui !), mais un autre espace de relation au monde, pour la raison suivante : c’est dès l’écriture, dans le temps de conception même, que l’auteur utilise ce miroir du monde, l’accroche à ses notes, sa documentation. On ne fait que sauver le processus même, rêve et recherche, de sa gestation.

Pris en défaut, Wikipédia ? Passe brièvement dans le texte un personnage au très étrange nom (il est canadien) Roubaix de l’Abrie Richey, aventurier et poète, « manière de Dylan Thomas ou de Thomas de Quincey », dit Robo. Un contributeur a ouvert une page à son nom dans Wikipédia anglophone, mais on en sait si peu sur ce personnage que la page est restée vierge. J’ai fait le lien quand même : et si un contributeur indiquait demain, dans la page de Robo le dandy, que le texte de Patrick Deville sur Tina Modotti en raconte un peu sur lui ? Et si au contraire, parce que ce lien est là comme un appel, quelqu’un complétait la page de Robo le dandy, nous-mêmes puissions actualiser le livrel de Patrick Deville (et chacun de nos lecteurs a bien entendu accès à cette mise à jour) ?

Gageons aussi que les contributeurs Wikipédia qui auront lu cette page iront d’eux-mêmes compléter la page de Patrick Deville.

Il me semble que nous sommes, ensemble, Wikipédia, l’auteur, et aussi l’éditeur numérique, dans un jour favorable. Et que le livrel, en se chargeant souterrainement de ses liens Wikipédia comme de ce miroir du monde, lui rend tout aussi bien hommage.

Merci de partager cette expérience.

Aucun commentaire 25/05/2010

La documentation et Vikidia

Il y a maintenant plus de 80 ans, alors que l’échec scolaire posait déjà problème, des enseignants furent conscients des insuffisances du cours magistral obligeant tous les élèves d’une classe à travailler au même instant sur le sujet imposé, sans qu’on tienne compte ni de leur rythme individuel, ni de leurs intérêts personnels qui auraient pu stimuler leur enthousiasme au travail.

D’autre part, le cloisonnement par disciplines étanches, traitées dans des manuels distincts, ne permettait pas de tisser des liens divers entre toutes les connaissances et de susciter un élan imprévu vers d’autres aspects du sujet, non seulement le comment, le pourquoi, le combien, mais aussi le regard sur ce qu’il en était autrefois ou actuellement ailleurs, ainsi que les traces dans notre langage, parfois imagé, et même des ouvertures vers certaines œuvres littéraires ou artistiques.

Ces enseignants qui voulaient moderniser l’école imaginèrent de créer coopérativement des fiches documentaires sur papier que chaque enfant pouvait étudier à son gré. Certaines apportaient une information, généralement illustrée, d’autres une incitation à l’observation ou à l’expérimentation (ne présentant aucun danger), enfin certaines signalaient diverses pistes de prolongement du sujet. Parmi ces fiches diverses, étalées sur une table, les enfants choisissaient, s’échangeaient les documents et, lors de la mise en commun de ce qu’ils avaient appris, ils retenaient avec enthousiasme beaucoup plus de connaissances qu’après un bon cours magistral.

Des enfants qui choisissent des livres de la petite bibliothèque de leur école près de La Forge dans le Missouri aux États-unis.

Le coin bibliothèque d’une classe.
(Russell Lee, domaine public)

Cette documentation était alimentée par les apports de nombreuses classes, grâce à des enquêtes, des recherches multiples. Par exemple, un enfant racontant le va-et-vient des hirondelles dans leur nid, construit sous le rebord de son grenier, suscitait l’envie des autres, selon leur goût et sans obligation systématique, de rechercher à quoi sert ce nid et comment la couvée permet l’éclosion des oisillons, de comparer les nids de divers oiseaux, leurs différentes façons de se nourrir, de se questionner sur les migrations des hirondelles et d’autres oiseaux, de demander à des amis alsaciens de parler des cigognes, d’étudier si les oiseaux sont les seuls à se reproduire en pondant des œufs, etc. Aux fiches déjà existantes s’ajoutaient parfois de nouvelles, issues de ces recherches.

Autre exemple: sur l’éléphant avaient été créées de multiples fiches, d’origines diverses, proposant sa description, les chiffres de sa taille, de son poids, mais aussi de son alimentation, l’usage de sa trompe, ses défenses (y compris l’utilisation de l’ivoire), sa vie en groupe dans la brousse, sa domestication comme bête de somme en Asie et même son utilisation pour la guerre par Hannibal (avec un extrait de Salammbô de Gustave Flaubert). On connaissait moins bien qu’aujourd’hui son cousin le mammouth et on ignorait encore les ravages du braconnage mettant en péril son espèce africaine.
L’utilisation de cette documentation était simple, à condition de veiller au classement et au rangement rigoureux après usage. Le principal problème pour obtenir une large collection se trouvait sur le plan de l’édition et de la mise à jour de certaines fiches. Ce qui amena à abandonner les fiches documentaires pour se limiter à une bibliothèque de travail, formée de brochures dont la gestion était alors plus facile, mais fut confrontée bien plus tard aux difficultés générales de l’édition.

L’informatique permet maintenant de classer et de retrouver de nombreux documents, mais ne résout pas magiquement tous les problèmes. Devant le déferlement permanent d’images et d’informations, parfois douteuses, les jeunes ont besoin de repères et de réponses à leurs questionnements auxquels les programmes scolaires n’apportent pas toujours de réponse non rébarbative. D’où l’importance d’une encyclopédie gratuite en ligne que l’on puisse consulter librement, en allant d’un article à l’autre sans avoir à manipuler plusieurs volumes imprimés.

Un garçon devant son ordinateur

Un garçon devant son ordinateur.
(Marisa Ravn, CC-BY-SA)

C’est ce qu’apporte avec succès Vikidia, l’encyclopédie des 8-13 ans. Cette tranche d’âges correspond au début de la maîtrise du raisonnement et de la lecture et s’arrête au seuil de l’adolescence qui a d’autres besoins et dispose d’autres moyens documentaires. Néanmoins le refus d’infantiliser le jeune lecteur permet à Vikidia d’être utilisable par toute personne, quel que soit son âge, désireuse de trouver des explications simples sur un sujet qu’elle ne connaît pas encore.
Il ne s’agit pas seulement de répondre par une simple définition, mais de proposer des pistes différentes, étroitement reliées au sujet, sans rester cloisonné dans une discipline scolaire, car les liens sont évidents, par exemple, entre l’abeille (insecte), le miel (aliment), l’apiculture (élevage), la pollinisation (botanique), le danger de certains pesticides (écologie). Et toutes ces ouvertures sont faciles à trouver en cliquant sur l’un des chapitres du sujet ou sur un lien interne.
Dans l’esprit wiki, chacun peut apporter ses contributions, y compris les jeunes qui peuvent poser des questions et proposer, si possible en groupe, le résultat de leurs recherches et enquêtes sur le sujet qui les intéresse. Le tout étant revu par des adultes compétents connaissant bien les besoins et les capacités des 8-13 ans pour réaliser une encyclopédie qui leur corresponde vraiment.

C’est ce que réussit Vikidia depuis plus de 3 ans et cela mérite d’être largement connu et reconnu de tous ceux qui s’intéressent à l’éducation.

Michel Barré
—-
Michel Barré est un enseignant à la retraite, il a pris part au mouvement de la pédagogie Freinet et est l’auteur du livre L’aventure documentaire disponible en ligne sur son site.

Vikidia est un projet qui ne dépend pas de la Wikimedia Foundation

5 commentaires 25/01/2010

Wikipédia par… Roland Moreno

J’ai le plaisir, ce soir, de mettre en ligne sur ce blog un texte de Roland Moreno parlant de Wikipédia. Roland Moreno est un inventeur, celui de la carte à puce. C’est également quelqu’un qui prend beaucoup de temps pour réfléchir aux choses du monde.

Nous sommes entrés en contact en décembre, au moment de la levée de fonds, par le biais d’OTRS, ce système de gestion de mails où les internautes posent des questions très diverses sur Wikipédia ou sur le mouvement Wikimedia. Roland Moreno cherchait à faire un don, et naturellement j’ai répondu à ses questions, comme nous sommes plusieurs à le faire tous les jours.

De là a commencé entre nous une conversation très intéressante tournant autour de Wikipédia et du mouvement Wikimedia. Mr Moreno aime Wikipédia. Il aime y trouver réponses à ses questions les plus diverses, il aime son dynamisme et sa générosité. Après bien des mails de discussion, je lui ai demandé s’il serait d’accord pour qu’on regroupe toute cette correspondance et que nous la publions sur le blog de Wikimédia France. Finalement, c’est un condensé de ses réflexions que vous trouverez ici.

Pourquoi faire cela ? Pour une raison simple : Roland Moreno est un lecteur de Wikipédia, bien plus qu’un contributeur (même s’il a déjà contribué). Le lecteur, c’est celui pour qui nous donnons chaque jour de notre temps. Le lecteur, c’est la finalité de tous nos projets : construire une encyclopédie ou un corpus de connaissance libre est bien, ça pourrait presque être une fin en soi. Mais le construire pour le mettre à la disposition du public lui donne un aspect nettement plus ouvert, et justifie encore plus toute l’énergie que nous mettons tous à ces projets.

Roland Moreno n’est pas « n’importe qui » non plus. Avec toute sa gentillesse, sa bonhommie et sa simplicité, il est cependant une des personnalités importantes du monde de la technologie actuelle, par l’importance fondamentale qu’a prise son invention. Il est donc important aussi pour nous de montrer que nos actions sont soutenues par des personnalités aussi fortes que lui.

Je ne souhaite qu’une chose, c’est que ce billet soit le premier d’une longue série de prise de parole des lecteurs au sujet de Wikipédia et des projets Wikimédia.

Bonne lecture !

Notes sur Wikipedia (par Roland Moreno)

C’est assez simple, en somme.
Wikipedia représente pour moi rien moins que l’inaccessible, le but ultime de toutes choses auxquelles j’aurais rêvé de consacrer ma vie.
• Un effort collectif considérable
• le talent inouï d’avoir su faire converger toutes ces générosités (ici : la générosité d’écrire)
• le talent et le mérite, non moins inouïs, d’avoir su organiser ça en un projet d’encyclopédie,
merveilleusement cohérent
• d’avoir, sur la durée, maintenu l’étincelle du bénévolat

• il n’y a pas que le bénévolat rédactionnel : il y a aussi l’organisationnel et même et surtout — disons le mot — informatique
– Wikipedia est une véritable cathédrale du XXIe siècle (c’est de son fonctionnement électronique que je parle ici) : la gestion de l’onglet HISTORIQUE doit représenter à elle seule des millions de lignes de code
– qui dit bénévole dit pas un rond : ça, c’est le miracle
– que ça se puisse

Wikipedia nous en offre à chaque minute la parfaite démonstration

– que ça ne soit pas éphémère
• c’est donc utile (le contraire de futile)
• pérenne (je n’ai plus aucune inquiétude à ce sujet)
• et c’est un succès — le mot est même un peu faible !
À la beauté et à l’intelligence, il faut absolument ajouter la gratuité, encore plus belle que celle de Google : non-profit organization, l’inaltérable Wikipedia n’a pas d’actionnaires à qui rendre des
comptes, de gouvernement chinois ou iranien devant qui s’incliner afin que ne soient pas
(justement !) contrariés lesdits
À la différence de Google (autre merveilleuse réalisation qui plusieurs fois par jour nous fait aimer
l’humanité), Wikipedia n’est pas une cash-machine
• aucune circulation d’argent, pas le moindre dollar en profit ou en perte
• pas de factures, aucun chiffre d’affaires, ni Nasdaq ni Wall-Street
• ni bonus, ni golden-parachutes, ni retraites-chapeau
• ne se répartit, de niveau en niveau, que le seul flux des dons

• enfin, apothéose du génie humain devant laquelle finir par se taire : aucune publicité d’aucune sorte,

— ni entrante
— ni sortante
— ni about
— aucun Sponsored link
— aucun souci lié au référencement.
Ne subsistent bavant mollement dans leurs coins que quelques grincheux, les inévitables sceptiques-à-qui-on-ne-la-fait-pas, éructant d’une voix de plus en plus inaudible que l’information de Wikipedia n’est même pas vérifiée et qu’on ne peut d’ailleurs être sûr de rien.

Le critère de loin le plus important, et donc le plus passionnant à observer de tous nos yeux émerveillés est celui du succès.
(L’utilité va un peu de soi, dès lors qu’on a réussi à éliminer du débat les sceptiques-à-qui-on-ne-la-fait-pas), et quant à la pérennité soyons simplement superstitieux et souhaitons que jamais ne se brise la boucle vertueuse : succès -> dons -> succès,
parce que le succès de l’entreprise Wikipedia est indépendant de son audience.

Voilà toute l’affaire : n’y aurait-il de part le monde que 11 utilisateurs de Wikipedia (onze en tout et pour tout), représentant un total de 33 connexions par mois que la réussite du projet Wikipedia serait quand même exemplaire, et que les cinquante bénévoles pourraient continuer, identiquement, le travail qu’ils font merveilleusement bien depuis dix ans.

Car Wikipedia n’a pas dans sa boucle la sanction de la publicité.

S’il n’y avait plus que onze téléspectateurs à regarder TF1, et onze Internautes à consulter Google
• le chiffre d’affaires de TF1 s’annulerait (en même temps que le cours de bourse), l’entreprise plierait instantanément

• le chiffre d’affaires de Google idem (cours de bourse idem), l’entreprise ne vivrait plus que du revenu des petites bannières Google (1/1000e du CA actuel ?), plus de Gmail gratuit, plus de Gearth gratuit, plus de Gmaps gratuits, etc. On plie. Et ce malheureusement, malgré l’immense intérêt de la prestation offerte par Google. (ce qui n’est pas le cas de TF1, à propos de quoi on peut vraiment parler de divertissement lambda.)

Situation résumée par ce récapitulatif

tableau récapitulatif

tableau récapitulatif

Incidence du contenu sur l’Audience

Voilà pourquoi Wikipedia constituera un précédent-clé dans l’histoire des médias.
Ceux qui occupent la scène sont ceux qui ont à voir avec le contenu :
• les consommateurs de contenu
• les moyens de fourniture du contenu

sachant que les annonceurs ne font pas partie du jeu, ce sont de purs parasites, la preuve :
• ils sont quasi-invisibles chez Google, béni soit Google
• il n’y en a pas chez Wikipedia.

D’une part, donc, les fournisseurs de contenu
• rédacteurs chez Wikipedia
• développeurs chez Google :
— créant des outils de référencement
— assurant la logistique du référencement
— et permettant l’exploitation d’une énorme bande passante.

D’autre part les consommateurs de contenu, c’est-à-dire the rest of us — chacun d’entre nous

Une fois payés
• le salaire des créateurs de contenu (zéro chez Wikipedia because bénévolat, ceci est un pur
détail)
• et la bande passante (machines, disques, bande passante proprement dite),

Les deux machines tournent, à la différence près d’un troisième personnage, l’annonceur, qui n’a pas
à voir avec la prestation, avec ce précieux contenu dont on fait bénéficier l’audience.

Google publierait-il, au lieu de ses résultats de recherche, les résultats sportifs, l’horoscope ou des textes pornographiques, cela ne changerait rien à la conduite des annonceurs (à audience égale) : ils paieraient l’espace pour insérer de la publicité.

Preuve ? Les chaînes de télévision, “bonnes” ou “mauvaises”, dès lors qu’elles ont une audience décente, sont toutes saturées d’annonceurs, il en va exactement de même pour les journaux.

Au contraire, Wikipedia ferait-il la même chose (horoscope, etc.) que les donations cesseraient
aussitôt.

Google et Wikipedia offrent chacun une prestation merveilleuse ; ce mot un peu plat au souci de qualifier la situation suivante : cette prestation est bonne pour tout le monde, c’est à dire tous les éléments constituant l’audience, chacun, unanimement, serait prêt à payer une somme significative (p ex 1 euro) pour la prestation si par malheur celle-ci devenait subitement payante (voir Canal+ qui prospère alors que le vulgum pecus regarde une télévision brute, c’est à dire gratuite)

Ce qui leur permet d’offrir cette prestation c’est a minima l’argent (et subsidiairement dans le cas de Wikipedia, la bonne volonté des bénévoles), sauf que ce n’est pas le même argent :
– c’est dans Google une rémunération de l’audience
– et dans Wikipedia une récompense pour la satisfaction.

Énormes nuances entre les 4 termes de ce vocabulaire précis :

    • rémunération = contrat, = règles, = commerce, = tribunal
      récompense = intitiative du donateur sans aucun incitatif
      audience = mesures, critères, contestations, autorité
      satisfaction = contentement, satiété, plénitude.
  • Le cas intéressant est évidemment celui de Wikipedia qui offre comparativement à Google :

    *       approximativement la même puissance de feu (bande passante, fréquentation)

    *       une même satisfaction quasi-infinie quant à la qualité de la prestation (et, dans le cas de Wikipedia, celle-ci étant unique au monde),

    mais présentent surtout, des caractéristiques opposées en termes de vulnérabilité/longévité en raison de l’absence, dans le logiciel (comme on dit désormais) Wikipedia de sanction publicitaire.

    Quant au critère de Satisfaction nombreuse :

    *       il ne bénéficierait sans doute pas à TF1

    *       et s’appliquerait sûrement à Google, mais reste (superbement) ignoré.

    (Ce sera le mot de la fin.)