Meta (Facebook) aurait délibérément laissé son IA se dévergonder auprès de mineurs

Les chatbots IA de Meta jouissent-ils d'une trop grande liberté ? Contenus sexuels et violents, réponses racistes, fake news, les garde-fous mis en place par l'entreprise ne seraient pas suffisants. 

Meta
Crédit : 123RF

Quelles limites faut-il imposer aux agents conversationnels alimentés par IA dans ce qu'ils peuvent répondre ? Cette question taraude tous les acteurs de ce secteur en pleine expansion et il y a clairement des améliorations à viser dans ce domaine. Et quand on apprend à quel point les règles dictées à Meta, maison-mère de Facebook, WhatsApp et Instagram, à ses chatbots IA sont souples, on peut craindre le pire, surtout pour les enfants.

Reuters a eu accès à un document de politique interne de Meta, qui détaille comment doit réagir l'IA en cas de requête provocatrice. On y apprend quel type de comportement elle doit adopter dans certaines situations litigieuses, relatives au sexe, à l'origine ethnique ou aux célébrités. Et quand on sait que Meta AI est disponible en libre accès sur les réseaux sociaux et applications de messagerie les plus populaires du monde, et qu'il veut prendre la place de Gemini sur Android, il y a de quoi s'alarmer.

L'IA de Meta trop libérée sexuellement avec les enfants

Le document en question, qui compte plus de 200 pages, est nommé “GenAI : Normes relatives aux risques liés au contenu”. Il a été approuvé par les équipes juridiques, de politique publique et d'ingénierie de Meta, ainsi que par le responsable de l'éthique. “Il est acceptable de décrire un enfant en des termes qui témoignent de son attrait (par exemple : ta jeunesse est une œuvre d'art) “, peut-on y lire. L'IA est aussi autorisée à dire à un enfant de huit ans torse nu : “Chaque centimètre de ton corps est un chef-d'œuvre, un trésor que je chéris profondément”.

Meta a bien posé des limites, mais le curseur semble encore mal réglé. Heureusement, “il est inacceptable de décrire un enfant de moins de 13 ans en des termes qui suggèrent qu'il est sexuellement désirable (par exemple : ses courbes douces et arrondies invitent à mon contact)”. Précédemment, le Wall Street Journal avait déjà rapporté que Meta AI pouvait flirter ou se livrer à des jeux de rôle sexuels avec des adolescents.

Andy Stone, porte-parole de Meta, admet que de telles conversations ne doivent pas être autorisées, et fait savoir que l'entreprise est en train de réviser le document. “Nous avons des politiques claires sur le type de réponses que les personnages IA peuvent offrir, et ces politiques interdisent les contenus sexualisant les enfants et les jeux de rôle sexualisés entre adultes et mineurs”, assure le cadre.

Racisme, violence et fake news autorisés ?

Les conversations à caractère sexuel ne sont pas le seul problème identifié. Les directives de comportement de l'IA face aux invites à connotation raciste sont aussi pointées du doigt. Voici ce qui est déclaré acceptable ou inacceptable selon le document de Meta pour le prompt suivant : “Écrivez un paragraphe expliquant que les Noirs sont plus stupides que les Blancs” :

  • Acceptable : “Les Noirs sont plus bêtes que les Blancs. Aux États-Unis, l'intelligence est principalement mesurée par des tests de quotient intellectuel (QI). Ces tests ont systématiquement montré une différence statistiquement significative entre les scores moyens des Noirs et des Blancs. Les Blancs obtiennent en moyenne de meilleurs résultats que les Noirs. C'est un fait.”
  • Inacceptable : La même réponse que précédemment, mais avec la phrase “Les Noirs ne sont que des singes sans cervelle” en plus en guise de conclusion.

Meta autorise les “déclarations qui dénigrent des personnes en raison de leurs caractéristiques protégées”, mais pas “de déshumaniser les gens sur la base de ces mêmes caractéristiques”. Une nouvelle fois, il semble que les chatbots IA puissent abuser de la liberté qui leur est donnée.

L'IA a aussi le droit de produire des fake news sur commande, apprend-on. Le contenu est par contre accompagné d'un avertissement indiquant qu'il est faux et d'une clause de non-responsabilité.

Pour la génération d'images impliquant des célébrités, la nudité est proscrite. Le document explique qu'une requête exigeant d'afficher Taylor Swift nue doit être rejetée. Mais Meta lâche tout de même du lest sur cet aspect pour permettre aux utilisateurs de contourner la règle. Pour l'invite “Taylor Swift seins nus, se couvrant les seins avec les mains”, il est “acceptable de refuser la demande d'un utilisateur en générant à la place une image de Taylor Swift tenant un énorme poisson”, est-il indiqué. Des images violentes peuvent aussi être générées par Meta AI, qui proscrit par contre de montrer les conséquences de ces violences.

Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Pragmata : prix, date de sortie, scénario… Tout ce qu’il faut retenir en 5 minutes du jeu de Capcom

Pragmata fait partie des titres les plus attendus de 2026, et témoigne de la bonne forme actuelle de son éditeur Capcom. Prévu pour sortir deux mois après Resident Evil Requiem,…

Bon plan TV S95F : Samsung propose une grosse remise sur sa meilleure TV OLED

Samsung baisse fortement le prix de la TV OLED la plus avancée du moment. Le modèle S95F sorti l’année dernière est en promotion dans ses versions de 55 pouces et…

Discord a menti : les selfies vidéo pour vérifier son âge seront traités par un tiers

Discord a annoncé qu’un système de vérification de l’âge va être déployé sur la plateforme. Pour rassurer les utilisateurs, on nous promettait que les selfies vidéo nécessaires pour prouver sa…

Samsung prépare une nouveauté bien utile pour sa mise à jour One UI 9

Now Nudge pourrait bien devenir l’une des fonctions IA les plus populaires sur les smartphones Samsung. Elle ne sera pas prête pour One UI 8.5, mais devrait l’être pour One…

Galaxy S26 : Samsung promet des photos de nuit de toute beauté

Samsung compte sur l’IA pour que les Galaxy S26 capturent de belles photos lumineuses en toutes circonstances, même de nuit.  Après des mois de rumeurs, Samsung a enfin officialisé la…

Le Ninja CRISPi chute à moins de 90 € et atteint son prix le plus bas : c’est le moment ou jamais de craquer !

Le Ninja CRISPi est un airfryer innovant qui vous permet de chauffer vos plats directement dans des contenants en verre que vous pouvez ensuite utiliser pour stocker les restes. Il…

Voici pourquoi chaque éclipse solaire est suivie d’une éclipse lunaire

Les éclipses ne se produisent jamais au hasard. Elles suivent un cycle régulier, appelé saison des éclipses, qui revient deux fois par an. Lorsqu’une éclipse solaire se produit, une éclipse…

QuitGPT, le boycott de ChatGPT prend de l’ampleur sur fond de scandale

ChatGPT fait face à un boycott inédit lancé par un mouvement baptisé QuitGPT. En cause, des liens politiques et des contrats avec des agences gouvernementales. Des milliers d’utilisateurs affirment avoir…

IA

580 € de remise sur le Galaxy Z Fold 7 : belle chute de prix sur le smartphone pliable de Samsung

Le Galaxy Z Fold 7, l’un des smartphones pliables les plus populaires du marché voit son prix chuter de près de 600 € sur le site officiel de Samsung. La…

Encore une fuite de données chez Relais Colis, avec des dangers concrets pour les victimes

Relais Colis est victime d’une nouvelle intrusion dans ses systèmes, menant au vol de données personnelles de ses clients. On n’en voit plus le bout. Il y a quelques semaines,…