22 novembre 2024 |

Ecrit par le 22 novembre 2024

L’Occitan fait son entrée dans l’outil de traduction de Google

Google vient d’intégrer 110 nouvelles langues à son outil de traduction Google Translate. Parmi elles, plusieurs langues régionales utilisées en France comme le Breton, le Corse et l’Occitan.

« L’intégration de l’Occitan, même si elle nous paraît tardive, témoigne de l’importance de son usage sur internet », se félicite la structure de défense de cette langue Assemblada Occitana qui rappelle que « grâce au travail de beaucoup de bénévoles, l’occitan est très présent sur internet, notamment dans Wikipédia et dans des applications diverses : WordPress, Windows… »
« Maintenant il faut améliorer la qualité de l’occitan traduit : il faut y garantir une grammaire authentique, la disponibilité des sept dialectes et la norme du Conseil de la langue occitane », insiste Assemblada Occitana.

S’il est difficile d’évaluer précisément le nombre de locuteurs, on estime tout de même qu’ils seraient près de 600 000 à parler couramment l’Occitan dans la partie Sud de la France. Le Provençal étant l’une des variantes encore utilisée par environ 200 000 personnes dans la région.

8% de la population mondiale concernée
Aujourd’hui, grâce à ces 110 nouvelles langues représentent plus de 614 millions de locuteurs (de quoi permettre à 8% de la population mondiale d’effectuer des traductions), Google Translate propose désormais 243 langues.

Afin de déterminer, l’intérêt d’une langue, Google évalue notamment le nombre de demandes reçues pour la prise en charge de la langue, le nombre de locuteurs de cette langue ainsi que la quantité de données disponibles pour former l’intelligence artificielle qui pourra faire ces traductions.

Objectif : 1 000 langues
« Il y a beaucoup de critères à prendre en compte lorsque l’on ajoute de nouvelles langues à Google Traduction, depuis les variétés de langues que nous proposons jusqu’aux orthographes spécifiques que nous utilisons, explique Constantin Foniadakis, porte-parole français de Google. Les langues intègrent énormément de variétés : variétés régionales, dialectes, normes orthographiques différentes. En fait, de nombreuses langues n’ont pas de forme standard et il est donc impossible de choisir la ‘bonne’ variété. Notre approche a consisté à donner la priorité aux variétés les plus couramment utilisées de chaque langue. Grâce à nos partenariats avec des linguistes spécialisés et des locuteurs natifs, nous continuons à faire de grands progrès. Et au fur et à mesure que la technologie progresse, nous allons continuer à prendre en charge encore plus de variétés de langues et de conventions orthographiques. »

A termes, Google a annoncé le lancement de la ‘1,000 Languages Initiative’ (initiative 1 000 langues), un engagement à construire des modèles d’IA qui prendront en charge les 1 000 langues les plus parlées dans le monde, sur les 6 000 à 7 000 dialectes de la planète.


L’Occitan fait son entrée dans l’outil de traduction de Google

La francophonie, également appelée espace francophone, désigne l’ensemble des pays et des institutions qui utilisent le français en tant que langue officielle. En grande partie portée par les dynamiques démographiques en cours, la francophonie connaît une forte croissance depuis le début du XXIe siècle et confirme sa place parmi les principaux espaces linguistiques de la planète. 

Comme le montrent les données de l’Organisation internationale de la Francophonie (OIF) reprises dans notre infographie, le monde francophone regroupait une population de près de 470 millions d’habitants en 2020, soit presque l’équivalent du monde hispanophone (475 millions la même année). À l’horizon 2030, et selon les projections démographiques actuelles, la francophonie devrait regrouper autour de 570 millions d’habitants, dont une bonne partie en Afrique – contre entre 510 et 520 millions pour les espaces hispanophones et arabophones.

Bien entendu, il est important de souligner que ces chiffres ne rendent pas compte du nombre exact de locuteurs de chaque langue. Par exemple, le français est la langue officielle unique de 13 pays, mais également une des langues officielles de 16 autres nations où il n’est pas parlé par la totalité de la population (Belgique, Suisse, Canada, Cameroun, etc.). De plus, on trouve également des francophones dans des pays où le français n’est pas une langue officielle. D’après les estimations publiées par le site Ethnologue, le nombre total de locuteurs du français (langue maternelle et seconde) se situe ainsi actuellement autour de 300 millions — faisant du français la cinquième langue la plus parlée.

De Tristan Gaudiaut pour Statista


L’Occitan fait son entrée dans l’outil de traduction de Google

Nos voisins britanniques sont les plus nombreux d’Europe à ne pas parler une autre langue que leur langue maternelle. C’est ce que révèlent des données de l’institut statistique de l’Union européenne Eurostat, sur lesquelles se base notre infographie. En 2016, près de deux tiers des britanniques disaient ne pouvoir parler qu’une seule langue. En Roumanie et en Hongrie, plus de la moitié des personnes interrogées disaient également ne parler que leur langue maternelle.

Si la France compte un plus grand nombre de personnes polyglottes – seulement 39,9 % de nos compatriotes interrogés disaient ne parler que leur langue maternelle en 2016 – le pays se classait tout de même au dessus de la moyenne européenne, qui se situait à 35,4 %. C’est en Europe du nord qu’on trouvait les nations avec les plus importantes proportions de personnes parlant plus d’une langue : la Suède, la Lettonie, le Danemark, la Norvège et l’Estonie comptaient tous moins de 10 % de personnes ne parlant que leur langue maternelle.

Valentine Fourreau pour Statista


L’Occitan fait son entrée dans l’outil de traduction de Google

La Journée internationale de la langue maternelle, créée par l’UNESCO en l’an 2000, est célébrée chaque année le 21 février dans le but de promouvoir la diversité linguistique et culturelle et le multilinguisme. L’occasion de se pencher sur la pratique de la langue française à travers le monde.

Cinquième langue mondiale par le nombre total de ses locuteurs, après le mandarin, l’anglais, l’espagnol et l’arabe, la langue française est la seule, avec l’anglais, à être présente sur les 5 continents du globe. Selon les dernières données disponibles de l’Organisation internationale de la francophonie, on estime qu’environ 321 millions de personnes sont capables de s’exprimer en français dans le monde. Comme l’illustre le graphique ci-dessus, la langue française est particulièrement présente en Afrique où se concentrent 60 % des francophones de la planète. Le Congo, l’Algérie et le Maroc sont les trois pays (hors France) qui en comptent le plus.

Le français est également beaucoup appris chez nos voisins européens et pratiqué par de nombreux frontaliers. Ainsi, l’Allemagne et l’Italie comptent au total plus de locuteurs de langue française que des pays où elle est une langue officielle, comme la Belgique, le Canada ou la Suisse, même si ces derniers ont une proportion de francophones ramenée à la population plus importante et que la pratique quotidienne y est plus répandue.

Claire Villiers pour Statista.


L’Occitan fait son entrée dans l’outil de traduction de Google

Mickaël Vallet, sénateur socialiste de Charente-Maritime,  dénonçait, récemment, l’utilisation démesurée de l’anglais et, pire du pire, du globish, (version très simplifiée de l’anglais), notamment par les cabinets de conseil sollicités par l’Etat.  Un jargon de « sachants » qui en définitive pourrait bien sonner plus creux qu’il n’y parait.  

Meeting, call, feed-back, slides, brainstorming, start-up nation, tous ces anglicismes sont aujourd’hui incontournables pour tous ceux qui se veulent « up-to-date », pardon « dans leur temps ». Un galimatias (ou charabia si vous préférez) qui, de l’avis du sénateur, est un nouveau conformisme conduisant à un formatage et un appauvrissement de la pensée. Plus le langage s’appauvrit plus la pensée s’appauvrit. Le peu fréquentable Joseph Goebbels disait : «  Nous ne voulons pas convaincre les gens de nos idées, nous voulons réduire le vocabulaire de telle façon qu’ils ne puissent plus exprimer que nos idées »*. Alors soyons plus que jamais vigilant. 

La pauvreté du langage peut aussi être synonyme d’exclusion
Le langage ne sert pas uniquement à communiquer. Il est parlant et peut en dire  beaucoup sur qui nous sommes. Dans un rapport remis au ministre de l’éducation nationale en 2007, le linguiste Alain Bentolila affirmait que : « à la fin du CE1 les enfants au vocabulaire le plus pauvre connaissent en moyenne 3000 mots. Ceux moyennement pourvus atteignent 6000, et le quartile supérieur à peu près 8000. » Inutile de préciser que le niveau de vocabulaire est directement dépendant des milieux sociaux dont sont issus les enfants. Des inégalités que notre système scolaire n’a malheureusement pas réussi à corriger. Pire cette pauvreté du langage peut aussi être synonyme d’exclusion.   

Une langue figée est une langue finie 
Bien sûr il ne s’agit pas de revenir à la marine à voile ou à l’utilisation inconsidérée du plus-que-parfait du subjonctif. Une langue doit savoir évoluer et s’adapter, fût-elle ancienne. Une langue figée est en définitive une langue finie. Mais il y a des usages dont il faut se méfier. Le fait n’est pas totalement nouveau, déjà, en son temps Molière se raillait des pseudos savants qui utilisaient un langage abscons, pédant, voire méprisant.  
Parfois, ces mots qui sonnent bien à l’oreille résonnent le creux ou le pas grand-chose.  
Ce globish a été importé par les firmes anglo-saxonnes et plus particulièrement par les cabinets de conseils d’outre-Atlantique. Vous savez ceux qui nous coûtent un pognon de dingue !
Comme le dit très justement le sénateur Vallet à propos des administrations : « quand on est payé par le contribuable, on le sert dans sa langue. Ca vaut pour l’administration comme pour ses dirigeants et ses prestataires ». Et pan sur le bec. 

Ici en Provence,  le langage oral (avec ou sans accent) reste primordial.  Peuchère ! 
Si au  français s’y ajoute les expressions provençales l’étendue du vocabulaire des habitants du cru  est sans aucun doute  bien supérieure à la moyenne nationale. Et on ne tient pas compte des interjections. Oh côquiiin… Le local : encore une bonne raison d’espérer…  


L’Occitan fait son entrée dans l’outil de traduction de Google

Avec plus de 63 % des sites web édités en anglais, la langue de Shakespeare domine sans surprise haut la main sur Internet. Pourtant, elle n’est employée que par environ 26 % des internautes, ce qui témoigne d’une certaine disproportion entre la langue des contenus et celle parlée par les utilisateurs.

À l’inverse, les locuteurs chinois représentent près de 20 % des internautes dans le monde, mais seulement 1,3 % du contenu web est édité en langues chinoises (les divers dialectes partagent le même système d’écriture). Comme le met en avant notre graphique, les sites hispanophones, lusophones et arabophones sont, dans une moindre mesure, également sous-représentés par rapport au nombre d’internautes locuteurs.

Cinquième langue la plus parlée et sixième la plus répandue sur Internet, le français présente en revanche un résultat plus équilibré. La langue de Molière est ainsi parlée par 3,3 % des internautes dans le monde et représente 2,5 % des sites web.

De Tristan Gaudiaut pour Statista

https://echodumardi.com/tag/langue/   1/1