Archive

Articles taggués ‘Google et Wikipédia’
4 commentaires 02/09/2010

Google Health Speaks – Google veut traduire des articles de Wikipédia sur la santé en Arabe, Indien et Swahili

Google a mené diverses actions afin d’aider à l’amélioration des articles de Wikipédia dans différentes langues. Durant Wikimania, la conférence annuelle dédiée aux projets Wikimédia et à la connaissance libre qui s’est déroulée en juillet dernier à Gdansk, Google avait présenté les outils et actions menées (article en anglais) avec le kit du traducteur Google pour améliorer les articles de Wikipédia. Saisissant l’occasion au vol, les équipes de Google ont profité de la conférence pour discuter et améliorer leurs processus de contribution aux articles.

À partir de cette première expérience, Google a mis en place une nouvelle opération destinée à apporter des informations liées à la santé pour les Wikipédia en arabe (AR), en hindî (HI) et en  swahili (SW).

L’opération est basée sur le Google Translation Toolkit et invite donc les personnes parlant anglais et l’une de ces 3 langues à traduire une liste d’articles de qualité issus de la Wikipedia anglophone. Afin de valoriser un peu plus le travail des bénévoles, Google fera un don de 3 cents par article mot traduit dans une des langues à 3 ONG médicales  (Children’s Cancer Hospital Egypt 57357, la Public Health Foundation of India et l’African Medical and Research Foundation (AMREF)).

Si vous souhaitez participer, cliquez ici (à défaut d’avoir des lecteurs qui parlent très bien swahili, sans doute certains sont-ils aussi arabophones).

Google, avec cette initiative, signe l’une des premières actions menées par une entreprise pour améliorer et développer les contenus de Wikipédia. Que pensez-vous d’une telle initiative ?  La voyez-vous comme une belle opportunité d’améliorer Wikipédia et d’attirer de nouveaux contributeurs ou au contraire comme une ingérence dangereuse  de l’entreprise dans Wikipédia ?

Merci à Stanlekub et Zil d’avoir noté l’erreur sur le don, c’est 3 cents par mot traduit et non par article.

Partagez cet article :
  • Twitter
  • Identi.ca
  • Google Bookmarks
  • Wikio FR
par Christophe Henner
Categories: Wikimedia, Wikipédia
Aucun commentaire 13/08/2009

Comment le futur de Google, Caffeine, référence t-il les articles de Wikipédia ?

Ce fut la nouvelle du jour, Google sort un nouveau moteur de recherche répondant au doux nom de Caffeine. Google a annoncé sur son blog que Caffeine n’allait rien révolutionner, que c’était une simple évolution du moteur actuel et qu’il donnerait des résultats de recherche plus pertinents que la version actuelle.

Depuis de nombreuses années, de nombreux Wikipédiens pensent que Google déclasse les articles de Wikipédia pour certains résultats de recherche. Pour l’instant aucune étude sérieuse sur le sujet n’a été menée pour étayer ces affirmations

Avec la sortie de Caffeine, et de ses résultats plus « pertinents », l’idée a refait surface que Google en profiterait pour modifier le référencement des articles de Wikipédia. C’est ce que j’ai voulu savoir en tirant quelques statistiques rapides.

Tout d’abord je suis bien conscient que les quelques requêtes que j’ai faites ne peuvent pas être représentatives de l’ensemble des requêtes possibles, mais les résultats obtenus sont, à mon sens, suffisamment tranchés pour avoir une bonne idée de l’évolution qu’est Caffeine.

Au final c’est donc une soixantaine de requête qui ont été comparées. Le choix des requêtes s’est fait selon plusieurs critères. Une première série de requêtes a été générée en fonction des articles de Wikipédia les plus lus au mois de juillet. Google adaptant ses résultats à l’actualité, il me semblait intéressant de voir l’impact que l’actualité peut avoir sur les résultats de Caffeine.
Deuxième série, des requêtes « bateaux ». Des noms de pays, de villes ou de personnages connus et sans réelle actualité pour le moment, le but cette fois-ci étant l’opposé de celui de la première série : voir les évolutions du référencement sur des requêtes relativement stables. Dernière série, les acronymes. Le but étant de voir comment Caffeine gère les requêtes pouvant avoir plusieurs significations. J’ai également couplé les deux premiers critères aux acronymes et ai soumis des acronymes ayant une actualité (clubs de foot notamment) et d’autres « bateaux ».

Comparatif statistique des résultats des requêtes de recherche de Google et Caffeine

Comparatif statistique des résultats des requêtes de recherche de Google et Caffeine

Comme on peut le voir sur le graphique, les résultats ont peu bougé, et plutôt vers un meilleur référencement des articles Wikipédia, mais rien de transcendant. Vu les évolutions, cela pourrait être mis sur le compte de l’évolution naturelle du référencement des sites. En revanche, il est plus intéressant de constater non pas l’évolution du référencement mais la pertinence des résultats.

Comparatif des résultats Google et Caffeine pour la requête JO

Comparatif des résultats Google et Caffeine pour la requête JO

Pour la requête JO, on voit clairement l’évolution. Tout d’abord Wikipédia ressort bien plus tôt dans les résultats de la recherche, mais au-delà d’un référencement meilleur, c’est surtout l’amélioration de la pertinence qui est remarquable. Alors que sur Google la requête JO nous donne pour résultat les articles « Jo-Wilfried Tsonga » et « Jeux olympiques d’été de 1936 » Caffeine nous donne des résultats bien plus pertinents avec « Jeux olympiques » et « Journal officiel de la République française« .

De même que pour les acronymes, par exemple pour TFC et OM, Caffeine propose, en plus des pages dédiées aux acronymes, la signification la plus courante (Toulouse Football Club et Olympique de Marseille).

Au final Caffeine ne modifie que légèrement le référencement des sites et quand elle le modifie, c’est souvent pour des résultats plus pertinents.

Cette « étude », qui n’en est pas une, n’est pertinente que par apport à la Wikipédia francophone, pour des recherches en français et localisées sur la France. Mais c’est un bon départ pour se faire une idée des évolutions de Caffeine.

Si vous tombez sur des requêtes aux résultats intéressants, dans un sens comme dans l’autre, n’hésitez pas à m’en faire part.

Partagez cet article :
  • Twitter
  • Identi.ca
  • Google Bookmarks
  • Wikio FR
par Christophe Henner
Categories: Wikipédia
,
6 commentaires 09/06/2009

Wikipédia utilisé dans Google News

Il y a peu nous vous faisions part d’une étude sur les thématiques abordées dans Wikipédia. Cette étude étaie l’idée reçue que Wikipédia possède des articles sur toutes les thématiques existantes. Biographies, culture, géographie, société et bien d’autres thèmes, font de Wikipédia une source d’information incontournable d’internet.

Ainsi, il n’est pas rare de compléter la lecture d’un article de presse en lisant l’entrée de Wikipédia sur le même sujet. C’est ce qu’a compris et implémenté Google News.

Logo de Google News

Logo de Google News

Google News est un outil fort utile pour avoir rapidement sous les yeux l’ensemble des articles publiés sur un thème donné. Pourtant, jusqu’à présent, il manquait des liens vers des meta-sites, des sites centralisant, agrégeant et retraitant l’information tel Wikipédia. Afin de pallier ce manque, l’équipe de Google News est en train de mener un test en ajoutant sous les articles un lien vers l’entrée de Wikipédia relative à la thématique.

http://www.niemanlab.org/images/wikipediagooglenews.jpg

Capture décran de Google News montrant l'insertion du lien Wikipédia

Pour le moment aucune annonce n’a été faite sur le blog officiel de Google News puisqu’il s’agit d’un test visible seulement par la minorité des personnes utilisant Google News avec un compte Google. Selon Gabriel Stricker, un des porte-parole de Google, le lien vers Wikipédia est là pour servir de référence sur un évènement d’actualité.

Si les scientifiques font de plus en plus confiance à Wikipédia, il semblerait que ce soit également le cas de Google qui intègre des liens vers Wikipédia dans de plus en plus de ses outils.

Et vous, que pensez vous de cette initiative ?

Partagez cet article :
  • Twitter
  • Identi.ca
  • Google Bookmarks
  • Wikio FR