CAIRN.INFO : Matières à réflexion

1De la même façon qu’il est extrêmement difficile de dire combien il y a de langues dans le monde (doit-on prendre en compte les dialectes, les formes régionales, etc. ?), il est malaisé de donner le nombre de leurs locuteurs. Voici par exemple trois classements des vingt premières langues du monde selon leur nombre de locuteurs, en ne comptant dans les trois cas que les locuteurs langue première (ou langues « maternelles »), selon trois sites consultés le même jour du mois de mars 2016.

Les vingt premières langues du monde (en millions de locuteurs)[1][2][3][4]

tableau im1
Ethnologue1 Statistiques mondiales2 Université Laval3 Mandarin : 897 Mandarin : 885 Mandarin : 845 Espagnol : 427 Espagnol : 358 Espagnol : 329 Anglais : 339 Anglais : 322 Anglais : 328 Arabe : 267 Arabe : 200 Arabe : 221 Hindi : 260 Bengali : 189 Hindi : 182 Portugais : 202 Hindi : 182 Bengali : 182,2 Bengali : 189 Portugais : 170 Portugais : 178 Russe : 171 Russe : 170 Russe : 144 Japonais : 128 Japonais : 120 Japonais : 122 Lahnda : 117 Allemand : 98 Allemand : 90,3 Javanais : 84,3 Coréen : 78 Javanais : 84,6 Coréen : 77,3 Français : 77 Wu : 77,2 Allemand : 76,9 Wu : 70 Télougou : 69,8 Français : 75,9 Vietnamien : 67 Vietnamien : 68,6
tableau im2
Télougou : 74,2 Télougou : 63,35 Marathi : 68,1 Marathi : 71,8 Cantonais : 66 Français : 67,8 Turc : 71,4 Marathi : 64,7 Coréen : 66,3 Ourdou : 68,6 Tamoul : 63 Tamoul : 65,7 Vietnamien : 68 Javanais : 60 Pendjabi4 : 62,6 Tamoul : 67,8 Turc : 59 Italien : 61,7

Les vingt premières langues du monde (en millions de locuteurs)[1][2][3][4]

2On voit que les trois classements ne coïncident que pour les quatre premières langues (chinois mandarin, espagnol, anglais, arabe), bien qu’ils divergent sur leur nombre de locuteurs. Dans l’ensemble du classement, si ce nombre est à peu près semblable pour le japonais, le tamoul ou le bengali, il varie beaucoup plus pour le portugais, crédité selon les listes de 170, 178 ou 202 millions de locuteurs. Et l’écart est encore plus grand pour l’italien qui n’apparaît ni sur la première liste (il est à la 21e place, avec 67,8 millions de locuteurs) ni sur la deuxième (il est à la 27e place avec 37 millions de locuteurs).

3Ce dernier exemple illustre parfaitement les difficultés auxquelles nous sommes confrontés. L’Italie comptait en 2015 une population de 60 795 612 habitants et l’on pourrait donc croire qu’il y a autant de personne ayant l’italien pour langue première. Mais c’est aller trop vite en besogne. Si les Italiens parlent sans doute tous italien, ils parlent également un certains nombre d’autres langues (comme le sarde, l’allemand, le franco-provençal, le slovène, le grec, le catalan, etc.) ou de dialectes (comme le sicilien, le vénitien, le lombard, etc.) qu’ils acquièrent dans la plupart des cas avant l’italien et parfois conjointement. Il y a donc une bonne partie de la population qui est bilingue, et l’on ignore souvent qu’il y a dans ce pays douze langues reconnues dans les textes officiels. Ainsi, l’article 6 de la constitution italienne stipule que « la République protège par des normes particulières les minorités linguistiques », et une loi du 15 décembre 1999 précise que :

4

En accord avec l’article 6 de la constitution et en harmonie avec les principes établis par les organismes européens et internationaux, la République protège la langue et la culture des populations albanaise, catalane, germanique, grecque, slovène et croate et de celles parlant le français, le franco-provençal, le frioulan, le ladino, l’occitan et le sarde.

5Et cette situation est loin d’être isolée. La France présente certes un degré de bilinguisme beaucoup moins important, mais si nous pouvons par exemple considérer que tous les Alsaciens, sauf quelques personnes âgées, parlent français, 50 % d’entre eux parlent également l’alsacien. Et, en Chine, le mandarin (appellation occidentale de la langue officielle de la Chine, le Putonghua, 普通話 « langue d’unification ») n’est la langue première que d’une partie de la population, essentiellement au nord du pays : d’autres parlent d’abord d’autres langues du groupe Han (langues de la famille chinoise, qui regroupent 96 % de la population dont une bonne partie est bilingue), comme le wu (plus de 70 millions de locuteurs), le cantonais (plus de 60 millions), le min nan (près de 50 millions, en particulier à Taïwan), etc., ou encore des langues « minoritaires » comme le tibétain, le ouigour, le mongol, etc.

Des difficultés pour nommer les langues

6Mais le tableau présenté ci-dessus illustre d’autres types de difficultés, en particulier le nom des langues. Le pendjabi par exemple semble n’apparaître que dans la troisième liste, sous l’appellation de « pendjabi de l’ouest ». Les linguistes distinguent en effet entre le pendjabi oriental, parlé par environ 30 millions de personnes au Pendjab et au Rajasthan, et le pendjabi occidental parlé par près de 90 millions de personnes en Inde et au Pakistan. Ce qui nous mènerait à 120 millions de locuteurs, mais encore faut-il savoir s’ils le parlent comme première, seconde ou troisième langue, ce qui est fréquent dans ces pays extrêmement plurilingues. Mais le pendjabi apparaît également dans la première liste sous l’appellation de lahnda qui est un autre nom, local celui-ci, du pendjabi occidental. Et ces appellations multiples ne sont pas rares. Ainsi, en France, beaucoup de locuteurs de langues régionales les appellent tout simplement « patois ». Dans le volet « famille » du recensement français de 1999, à la question « en quelles langues, dialectes ou patois vos parents vous parlaient-ils quand vous étiez enfants, vers l’âge de cinq ans », de nombreuses réponses, outre « patois », étaient du genre « marocain », « patois vendéen », « patois local », « sénégalais », « patois nordiste », voire « africain ». Il va de soi que le « sénégalais » n’est pas une langue (on compte au Sénégal plus de 20 langues) et que face aux quelques 2000 langues parlées en Afrique, la dénomination « africain » n’est guère précise. Il y a ainsi en France des gens, en particulier issus de l’immigration, qui ne connaissent pas le nom de leur langue d’origine.

7Face à ce flou, à ces noms multiples, les linguistes peuvent donc être embarrassés. Cette multiplicité des noms pour une même langue peut être le fait des locuteurs eux-mêmes ou le résultat des expansions coloniales. Ainsi un groupe peut donner un nom péjoratif à la langue d’un autre groupe, ou des groupes parlant la même langue peuvent la nommer différemment, et les envahisseurs européens ont pu donner aux langues africaines ou indiennes qu’ils rencontraient des noms étranges. C’est ainsi que, par approximation phonétique, le bamanankan du Mali est devenu bambara, ou qu’en Amérique du Nord le mot sioux est la francisation de nadoweisiw, nom que les Ojibwas donnaient à leurs ennemis Dakotas, le peuple et leur langue (Hagège, 2009). De la même façon le guarani, langue parlée au Paraguay et dans une partie de l’Argentine, de la Bolivie et du Brésil est-il appelé par ses locuteurs avañe’ẽ (« langue des êtres humains »).

8On voit donc qu’une même langue peut avoir plusieurs noms ; mais il arrive aussi qu’un même nom corresponde à plusieurs langues. À l’époque de ce qu’on appelle aujourd’hui « l’ex-Yougoslavie », on considérait que cette République fédérale avait une langue, le serbo-croate. Après l’explosion de cette fédération en pays différents, leurs citoyens insistent aujourd’hui, pour des raisons à la fois politiques et idéologiques, sur le fait qu’ils parlent serbe, croate ou bosniaque, même s’ils se comprennent parfaitement. Et il s’est produit la même chose en Inde où, au milieu des années 1930, Gandhi considérait qu’une fois l’indépendance acquise l’hindoustani pourrait être la langue d’unification du pays, remplaçant l’anglais en fonction officielle. Mais les musulmans écrivait cette langue à l’aide de l’alphabet arabe, empruntaient pour leurs néologismes à l’arabe ou au farsi et l’appelaient ourdou, tandis que les hindouistes l’écrivaient à l’aide de l’alphabet devanagari, empruntaient au sanscrit et l’appelaient hindi. Après l’indépendance de l’Inde, on procéda à une partition en créant le Pakistan, dont l’ourdou est aujourd’hui la principale langue tandis que l’hindi est la principale langue de l’Inde, et leurs locuteurs se comprennent de moins en moins.

Le cas des langues romanes

9Nous n’avons certes pas ces problèmes de désignations diverses pour les langues romanes mais, pour revenir au thème de ce numéro et au titre de cet article, reste le problème de savoir comment compter le nombre de locuteurs d’une langue ou d’un groupe de langues. Doit-on prendre en compte ceux qui les parlent comme langue première (ou maternelle) ou comme langue seconde, voire troisième, comme langue identitaire, comme langue de culture ou comme langue véhiculaire ? Si nous ne considérons que les locuteurs de langues « maternelles », les langues du monde les plus parlées seraient, dans cet ordre, le chinois mandarin, l’anglais, l’espagnol, le bengali, l’hindi, le portugais, tandis que le français ne pointerait qu’à la quatorzième place. Dans le second cas, si nous prenons en compte tous les locuteurs, les principales langues véhiculaires seraient, selon le baromètre des langues du monde [5], l’hindi, l’indonésien et le swahili, le chinois reculant à la dixième place, le français avançant à la onzième. Et, selon le même baromètre, après traitement statistique de onze facteurs pertinents, l’espagnol serait à la seconde place, le français à la troisième, l’italien à la huitième, le portugais à la neuvième, le catalan à la dix-neuvième, etc.

10Pour ce qui concerne donc les langues romanes, et malgré les difficultés de comptage, nous pouvons considérer qu’il y aurait près de 330 millions de locuteurs de l’espagnol, près de 200 pour le portugais, plus de 70 pour le français, environ 60 pour l’italien, 20 pour le roumain, un peu plus de 10 pour le catalan, etc., soit autour de 700 millions. Mais il s’agit ici de locuteurs langue première. Le français en Afrique et l’espagnol en Amérique du Sud jouent une fonction véhiculaire non négligeable, qu’il est difficile de chiffrer, mais qui augmente notablement ce nombre.

11Reste à prendre en compte les gens qui étudient ces langues. Un article du Washington Post[6] a donné une évaluation des langues les plus apprises dans les écoles du monde entier. Après l’anglais, champion toutes catégories avec 1,5 milliard d’apprenants, on trouve le français (82 millions), le chinois (30 millions), l’allemand et l’espagnol (14,5 millions chacune), l’italien (8 millions) et le japonais (3 millions). Et, comme on verra dans un autre article de ce numéro [7], une étude portant sur l’enseignement des langues dans les universités du monde entier montre que l’anglais est enseigné dans 97 % des universités, le français dans 75 %, l’allemand dans 62 %, l’espagnol des 51 %, l’italien dans 41 %, le russe dans 39 %, le chinois dans 38 %, le japonais dans 35 %, l’arabe dans 29 %, le portugais dans 24 %, etc. Mais il est bien sûr difficile d’évaluer la compétence de ces apprenants à la sortie du cycle scolaire ou universitaire. Et comment compter les gens qui les apprennent sur le tas, dans les rues africaines par exemple pour l’anglais, le français et le portugais, et qui pratiquent des formes approximatives de ces langues ?

12Nous avons donc, face à la question « combien de gens parlent telle ou telle langue romane », une imprécision quasi obligatoire. Quoi qu’il en soit, et toutes catégories confondues, le chiffre d’un milliard de locuteurs des langues romanes constitue une approximation acceptable. Et, si la démographie africaine s’avère conforme aux prévisions, si certains pays africains conservent comme langue officielle la langue de l’ancien colonisateur et si la scolarisation progresse, le français et le portugais devraient trouver dans ce continent un réservoir important de nouveaux locuteurs.

Notes

Référence bibliographique

  • Hagège, C., Dictionnaire amoureux des langues, Paris, Plon, 2009.
Louis-Jean Calvet
Louis-Jean Calvet est l’auteur de nombreux livres consacrés à la linguistique, la sociolinguistique et les politiques linguistiques. Il est en outre le créateur, avec son frère Alain Calvet, du baromètre des langues du monde et du baromètre des langues africaines.
Université Aix-Marseille
Dernière publication diffusée sur Cairn.info ou sur un portail partenaire
Mis en ligne sur Cairn.info le 23/09/2016
https://doi.org/10.3917/herm.075.0042
Pour citer cet article
Distribution électronique Cairn.info pour CNRS Éditions © CNRS Éditions. Tous droits réservés pour tous pays. Il est interdit, sauf accord préalable et écrit de l’éditeur, de reproduire (notamment par photocopie) partiellement ou totalement le présent article, de le stocker dans une banque de données ou de le communiquer au public sous quelque forme et de quelque manière que ce soit.
keyboard_arrow_up
Chargement
Chargement en cours.
Veuillez patienter...