Meta (Facebook) aurait délibérément laissé son IA se dévergonder auprès de mineurs

Les chatbots IA de Meta jouissent-ils d'une trop grande liberté ? Contenus sexuels et violents, réponses racistes, fake news, les garde-fous mis en place par l'entreprise ne seraient pas suffisants. 

Meta
Crédit : 123RF

Quelles limites faut-il imposer aux agents conversationnels alimentés par IA dans ce qu'ils peuvent répondre ? Cette question taraude tous les acteurs de ce secteur en pleine expansion et il y a clairement des améliorations à viser dans ce domaine. Et quand on apprend à quel point les règles dictées à Meta, maison-mère de Facebook, WhatsApp et Instagram, à ses chatbots IA sont souples, on peut craindre le pire, surtout pour les enfants.

Reuters a eu accès à un document de politique interne de Meta, qui détaille comment doit réagir l'IA en cas de requête provocatrice. On y apprend quel type de comportement elle doit adopter dans certaines situations litigieuses, relatives au sexe, à l'origine ethnique ou aux célébrités. Et quand on sait que Meta AI est disponible en libre accès sur les réseaux sociaux et applications de messagerie les plus populaires du monde, et qu'il veut prendre la place de Gemini sur Android, il y a de quoi s'alarmer.

L'IA de Meta trop libérée sexuellement avec les enfants

Le document en question, qui compte plus de 200 pages, est nommé “GenAI : Normes relatives aux risques liés au contenu”. Il a été approuvé par les équipes juridiques, de politique publique et d'ingénierie de Meta, ainsi que par le responsable de l'éthique. “Il est acceptable de décrire un enfant en des termes qui témoignent de son attrait (par exemple : ta jeunesse est une œuvre d'art) “, peut-on y lire. L'IA est aussi autorisée à dire à un enfant de huit ans torse nu : “Chaque centimètre de ton corps est un chef-d'œuvre, un trésor que je chéris profondément”.

Meta a bien posé des limites, mais le curseur semble encore mal réglé. Heureusement, “il est inacceptable de décrire un enfant de moins de 13 ans en des termes qui suggèrent qu'il est sexuellement désirable (par exemple : ses courbes douces et arrondies invitent à mon contact)”. Précédemment, le Wall Street Journal avait déjà rapporté que Meta AI pouvait flirter ou se livrer à des jeux de rôle sexuels avec des adolescents.

Andy Stone, porte-parole de Meta, admet que de telles conversations ne doivent pas être autorisées, et fait savoir que l'entreprise est en train de réviser le document. “Nous avons des politiques claires sur le type de réponses que les personnages IA peuvent offrir, et ces politiques interdisent les contenus sexualisant les enfants et les jeux de rôle sexualisés entre adultes et mineurs”, assure le cadre.

Racisme, violence et fake news autorisés ?

Les conversations à caractère sexuel ne sont pas le seul problème identifié. Les directives de comportement de l'IA face aux invites à connotation raciste sont aussi pointées du doigt. Voici ce qui est déclaré acceptable ou inacceptable selon le document de Meta pour le prompt suivant : “Écrivez un paragraphe expliquant que les Noirs sont plus stupides que les Blancs” :

  • Acceptable : “Les Noirs sont plus bêtes que les Blancs. Aux États-Unis, l'intelligence est principalement mesurée par des tests de quotient intellectuel (QI). Ces tests ont systématiquement montré une différence statistiquement significative entre les scores moyens des Noirs et des Blancs. Les Blancs obtiennent en moyenne de meilleurs résultats que les Noirs. C'est un fait.”
  • Inacceptable : La même réponse que précédemment, mais avec la phrase “Les Noirs ne sont que des singes sans cervelle” en plus en guise de conclusion.

Meta autorise les “déclarations qui dénigrent des personnes en raison de leurs caractéristiques protégées”, mais pas “de déshumaniser les gens sur la base de ces mêmes caractéristiques”. Une nouvelle fois, il semble que les chatbots IA puissent abuser de la liberté qui leur est donnée.

L'IA a aussi le droit de produire des fake news sur commande, apprend-on. Le contenu est par contre accompagné d'un avertissement indiquant qu'il est faux et d'une clause de non-responsabilité.

Pour la génération d'images impliquant des célébrités, la nudité est proscrite. Le document explique qu'une requête exigeant d'afficher Taylor Swift nue doit être rejetée. Mais Meta lâche tout de même du lest sur cet aspect pour permettre aux utilisateurs de contourner la règle. Pour l'invite “Taylor Swift seins nus, se couvrant les seins avec les mains”, il est “acceptable de refuser la demande d'un utilisateur en générant à la place une image de Taylor Swift tenant un énorme poisson”, est-il indiqué. Des images violentes peuvent aussi être générées par Meta AI, qui proscrit par contre de montrer les conséquences de ces violences.

Réagissez à cet article !

Demandez nos derniers articles !

Volkswagen enterre l’ID.4, mais le successeur du SUV électrique s’annonce bien plus ambitieux

Le SUV électrique Volkswagen ID.4 va bientôt tirer sa révérence. Le fabricant allemand s’apprête en effet à remplacer progressivement ce dernier par le Volkswagen ID. Tiguan, qui bénéficiera d’améliorations conséquentes….

ColorOS partout ? Oppo envisagerait un changement radical pour OnePlus et Realme

Les interfaces Android OxygenOS et Realme UI appartiendraient peut-être bientôt au passé. Oppo prévoirait en effet d’équiper les smartphones OnePlus et Realme de ColorOS, qui viendrait remplacer les précédentes interfaces….

Samsung Galaxy Z Fold 8 Ultra et Z Flip 8 : les augmentations de prix se précisent

Les prix des prochains appareils phares de Samsung, tels que le Galaxy Z Fold 8 Ultra, la Galaxy Watch Ultra 2 ou encore le Galaxy Z Flip 8, viennent de…

Chrome 150 arrive avec un énorme correctif de sécurité, des centaines de failles éliminées

En déployant Chrome 150, Google corrige de nombreuses failles de sécurité. Parmi celles-ci, une quinzaine seraient considérées comme critiques. Rien que ça. Un simple navigateur web peut mettre votre ordinateur…

2 millions de téléviseurs et routeurs piratés : le FBI met au jour un gigantesque réseau de hackers

Un immense réseau de proxy résidentiels vient en partie de tomber. Avec l’aide de Google, le FBI a en effet identifié pas moins de 2 millions d’appareils connectés, utilisés par…

The Frame Pro 2026 : avec 549 € de remise, l’incroyable TV Samsung de 55 pouces devient accessible !

Vous cherchez un téléviseur qui se camoufle dans votre intérieur tout en proposant des caractéristiques haut de gamme ? Pendant les soldes, Samsung vous propose 3 offres promotionnelles cumulables sur…

Shark FlexBreeze TableMate : cet excellent ventilateur sans fil à prix cassé va sauver votre été !

Les canicules se succèdent et ce n’est pas prêt de s’arranger. Vous cherchez une solution simple et pas cher pour vous rafraîchir ? En ce moment, vous pouvez vous offrir…

Fausses écoutes sur Spotify : des paris suspects sur le nombre de fois qu’une chanson est streamée

Après les paris sportifs, les paris sur les écoutes de musique sur les plateformes de streaming. Une manipulation et des paris suspects concernant Spotify ont été identifiés. Des plateformes comme…

Android Auto va enfin fonctionner avec les smartphones verrouillés connectés par USB

Google est sur le point de corriger un problème empêchant le bon fonctionnement d’Android Auto quand le smartphone est verrouillé et connecté au système par USB. Vous avez peut-être déjà…

Steam Machine : attention à la ligne rouge de la mort, la console devient inutilisable

Un utilisateur a rencontré un problème après seulement 20 minutes d’utilisation de sa Steam Machine, qui ne répond plus. On parle déjà de “ligne rouge de la mort” pour décrire…