Overblog Suivre ce blog
Editer l'article Administration Créer mon blog
16 avril 2006 7 16 /04 /avril /2006 17:19
Pardon à vous, mais j'avais envie de faire ce jeu de mot naze :
Wikipédiens de tous les pays, unissez-vous! Vous avez tout à gagner de ces liens.
Maintenant que c'est fait, passons aux choses sérieuses.

Je n'apprendrai rien à personne en disant que Wikipédia est une encyclopédie libre en ligne que j'aime (je lui écris même des poèmes), que j'utilise (beaucoup), à laquelle je contribue (un peu) et dont je suis plus ou moins régulièrement l'évolution.
En un jour, en face de la page d'acceuil internationale, je me suis prise à réfléchir en comptant sur mes doigts.
Cette page, qui a à peu près la tête ci-dessous, met en évidence les langues qui comportent plus de cent mille articles. Et comme le résultat est un peu surprenant, j'ai essayé de mettre tout ça au clair.



Disclaimer

  • Oui, je sais, la valeur d 'une encyclopédie ne se mesure pas au nombre des ses articles. (Par ici pour d'intéressantes considérations sur la comparaison  de taille de corpus, et le rapport taille/qualité.)
  • Oui, je sais, il est toujours délicat de dénombrer les locuteurs d'une langue, même sans compter les locuteurs secondaires.
  • Oui, je suis bien consciente que pour participer à Wikipédia il faut une certaine maîtrise des outils informatiques et surtout un accès à Internet.
C'est bon? On peut commencer?


La première chose qu'on remarque devant cette page, c'est qu'elle n'a superficiellement rien de remarquable : LV1 : anglais, LV2: allemand, et puis bien sûr, un quart de million d'articles en français, youpi tralala, cocorico.
La suite est plus surprenante : la version polonaise? suédoise? et puis pourquoi la version espagnole est-elle si discrète?


Langue

Nombre d'articles Wikipédia

Nombre de locuteurs (millions)

Rang

(nombre de locuteurs)

Rapport articles/M. de locuteurs

= productivité globale

Anglais

1 064 000

450

1

2 364

Allemand

380 000

120

6

3 167

Français

266 000

285

3

933

Polonais

225 000

55

8

4 091

Japonais

199 000

127

5

1 567

Néerlandais

163 000

28

9

5 821

Suédois

150 000

9

10

16 667

Italien

149 000

70

7

2 129

Portugais

125 000

210

4

595

Espagnol

107 000

330

2

324


Le premier facteur à prendre en compte, c'est la taille de la population parlant une langue donnée.
Parce qu'après tout, on ne peut pas attendre de la population basque qu'elle réussisse à construire une version aussi vite que la communauté anglophone!
Basé là-dessus, on attendrait un podium du genre
1 Chinois, 2 Espagnol 3 Hindi 4 Anglais,
mais d'autres contingences s'imposent : les Chinois ont peu accès au net, et de façon très contrôlée, tandis que les hindophones sont plus susceptiles de participer à la version anglaise de Wikipédia...

Calculons donc un petit rapport qui donne le nombre d'articles en une langue par le nombre de (millions de) ses locuteurs (source : Wikipedia. 2000).
Appellons le "Productivité globale" et voyons comment les dix langues prises en compte s'en sortent :

Langue Productivité globale
(rang)
Suédois 1
Néerlandais 2
Polonais 3
Allemand 4
Anglais 5
Italien 6
Japonais 7
Français 8
Portugais 9
Espagnol 10

Le résultat est éloquent : le suédois, puis le  néerlandais et le polonais trônent loin devant les langues anglo-saxonnes (allemand et anglais), le japonais et surtout les langues latines. Le bonnet d'âne revient à l'espagnol, de façon sans doute biaisée par le fait que les habitants des pays sud-américains hispanophones sont en moyenne moins connectés au net que, par exemple, les Italiens (c'est une estimation à la louche, tombez-moi dessus si ça vous paraît un préjugé infondé).

Mais on peut essayer d'affiner cette première approche, en utilisant les statistiques  aimablement fournies par Wikipédia : on dispose, pour chaque version, du nombre de contributeurs, voire d'indices d'activité.
Je me suis basée sur les chiffres de novembre 2005, les plus récents à être disponible pour toutes les langues concernées. Voici les résultats :

Langue Nombre de contributeurs articles/contributeur
= productivité individuelle
contributeurs/ million locuteurs
= implication
Anglais 48 877 22 109
Allemand 18 344 21 153
Français 6 152 43 22
Polonais 2 444 92 44
Japonais 4 317 46 34
Néerlandais 2 505 65 89
Suédois 1 331 113 148
Italien 1 959 76 28
Portugais 1 503 83 7
Espagnol 2 881 37 9

On a donc gagné l'insigne privilège de calculer deux nouveaux rapports :
- le premier qui  évalue le nombre moyen d'articles par contributeur (productivité individuelle)
- et l'autre la proportion de contributeurs à Wikipédia dans la population en ppm, ce que j'appelle hardiment l'implication, à défaut d'une meilleure idée.

 Et bien sûr, le podium :


Langue Productivité
individuelle (rang)

Langue Implication
(rang)
Suédois 1
Allemand 1
Polonais 2
Suédois 2
Portugais 3
Anglais 3
Italien 4
Néerlandais 4
Néerlandais 5
Polonais 5
Japonais 6
Japonais 6
Français 7
Italien 7
Espagnol 8
Français 8
Anglais 9
Espagnol 9
Allemand 10
Portugais 10

Lorsque les deux rapports sont liés, on peut conclure à une population dingue de Wikipédia, avec une forte proportion de la population qui participe beaucoup, comme chez les Suédois.
Au contraire, quand les deux indicateurs ne se suivent pas, on a des situations plus contrastées : les locuteurs allemands sont très nombreux à participer à Wikipédia, mais  chacun d'entre eux ne fout, il faut bien le dire, pas grand'chose.

Et pour les coqs de clocher, j'ajouterai, chers compatriotes et camarades francophones, que la langue française est 7e en productivité individuelle et seulement 8e en implication...

Allez hop, au boulot!!

Partager cet article

Repost 0
Published by Abie - dans Wikipédies
commenter cet article

commentaires

Dominique 17/04/2006 10:32

On peut rapporter cela au nombre de pages Web qui étaient créées dans chacune des langues il y a dix ans. Les statistiques doivent encore se trouver. L'anglais dominait largement bien sûr, l'espagnol, l'italien et le portugais étaient presque inexistants, mais il y avait proportionnellement plus de pages en néerlandais et en suédois qu'en français (le français étant surtout alimenté par des Québécois) ou en japonais. D'ailleurs, globalement, l'Europe du Nord (pays de langues scandinaves et Finlande) était la plus équipée et la plus connectée. Le changement majeur de ces dix dernières années, c'est la présence du polonais et je me demande si l'on ne retrouverait pas la même implication pour des langues de la nouvelle Europe qui sont dix ou vingt fois moins parlées (pays baltes, Tchéquie, Slovaquie). Le fossé est en train de se réduire à mon avis.
Un autre point au sujet de Wikipedia et les langues, c'est que le faible nombre de contributeurs et d'articles dans des langues minoritaires, rares, régionales pose le problème de la neutralité des articles. Les rédacteurs dans ces langues sont avant tout des activistes, parfois issus de mouvements extrémistes ou des personnes qui ont une vision très orientée des pays, des peuples, des cultures, de l'histoire. Et comme la connaissance d'une langue rare est nécessaire pour comprendre, il n'y a guère de contradicteurs, mais le même texte dans une langue véhiculaire ferait bondir tout le monde. De la même manière, les textes en esperanto sont rédigés par des espérantistes qui n'ont comme contradicteurs que les partisans de l'ido ou de l'interlingua qui n'apprécient pas la présentation de leur langue : on est dans un cas de figure où la langue est le reflet d'un engagement culturel et dans ce domaine je crois que la neutralité de Wikipedia est un mythe.

Edito

Soyez les bienvenus sur ce petit blog sans ligne éditoriale fixe, qui échoue à mourir depuis 2005.
La fréquence de mise à jour se veut quotidienne au mieux (par ce que je suis de nature optimiste), trimestrielle au pire (parce que je suis velléitaire bien plus encore).

Alea jacta est :


Aussi :



Ordo Ab Chao