L’IA pourrait tuer la langue française, voici comment ces experts comptent l’en empêcher
Plusieurs spécialistes de l'intelligence artificielle estiment que les modèles mettent la langue française en danger. Ils appellent à mettre en œuvre les moyens nécessaires à sa sauvegarde.

Vous en avez sûrement déjà fait l'expérience lors d'une recherche sur Google, par exemple sur un problème informatique. Vous tapez votre question et obtenez des résultats qui ne vous aident pas vraiment. Puis vous faites la même requête, mais cette fois-ci en anglais. Et là la réponse que vous cherchiez est presque immédiate. Ça n'a rien de surprenant : la langue anglaise est la plus utilisée au monde après tout. Et c'est aussi le cas pour l'entraînement de l'intelligence artificielle.
Les modèles IA ont besoin de données pour apprendre. Or, ces dernières sont très majoritairement dans la langue de Shakespeare. En 2024, une étude estimait que la version 3 de ChatGPT était entraînée sur moins de 8 % de contenus autres qu'anglais. Un chiffre qui alerte des experts voulant défendre la place du français dans le monde, ce qui passe aussi par l'entraînement des modèles de langage.
L'IA met en danger la langue française, ces experts tirent la sonnette d'alarme
Ce n'est pas la France qui est à l'initiative de cette prise de conscience, mais le Québec. Le pays nord-américain est connu pour protéger le français bien plus agressivement que l'Hexagone. Pour le professeur Destiny Tchéhouali, cotitulaire de la chaire Recherche du Québec sur l’intelligence artificielle et le numérique francophones, ce n'est pas un problème anodin.
“La vision du monde, les tournures de pensées, et les contenus proposés par l’IA ne sont pas neutres. Il y a des secteurs vraiment très sensibles dans lesquels on voit concrètement des biais générés“, explique-t-il.
Lire aussi – Ne posez pas cette question à ChatGPT, il va vous rendre fou
Éducation, justice, sciences… Autant de domaine où l'anglais domine, ce qui fait craindre l'émergence d'un “modèle hégémonique” gommant les spécificités culturelles et linguistiques. Pour y remédier, la solution est simple, du moins sur le papier. “Il faut aller à la source du problème et enrichir les bases de données et les corpus de contenus francophones“.
Plus facile à dire qu'à faire cela dit. Mehdi Benboubakeur est organisateur du MTL Connecte, un rassemblement où chercheurs et acteurs de l’industrie numérique parle d'IA (entre autres) quasi-exclusivement en français. Il pense que la clé réside dans une coopération renforcée entre les pays francophones afin de développer des concurrents sérieux aux modèles américains. L'appel est lancé.
Source : Le Monde

