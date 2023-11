Le secteur de l’IA est à peine né qu’il est en passe de connaître sa première grande crise. Les données naturelles de qualité commencent à manquer.

Un an après la sortie de ChatGPT, c’est désormais indéniable, l’IA fait de véritables prodiges, tant du point de vue de la productivité que de la créativité, certains modèles de langages étant même capables de créer des œuvres originales ex nihilo… en apparence. Car pour les concepteurs de cette technologie, il n’y a pas de hasard ; si l’IA est parvenue à ce stade de développement, c’est grâce à la formidable quantité de données qu’elle a ingurgitée pour s'entraîner.

D’après la Professeure Rita Matulionyte de l’Université Macquarie en Australie, les machines pourraient rapidement arriver à bout de toutes les données disponibles. En d’autres termes, l’IA n’aura bientôt plus rien à se mettre sous la dent pour se former, et dans un avenir très proche, les chatbots pourraient commencer à ressasser les mêmes idées. Les prévisions les plus alarmistes évoquent cette grande pénurie à l’horizon 2026.

Les IA ont consommé presque toutes les données disponibles pour leur entraînement

L’heure est grave. Si « un algorithme est entraîné sur une quantité insuffisante de données, il produira des résultats inexacts ou de mauvaise qualité ». Les concepteurs d’IA en sont bien conscients, mais il n’y a malheureusement rien qu’ils puissent faire pour compenser ce manque. Certains essaient bien de former leurs machines avec des ensembles de données créés par des chatbots, mais cette technique montre déjà ses limites, les recherches indiquant que cet entraînement aboutit à des résultats « confus et inquiétants », à l’image de cette bande-annonce de film pour enfants, au résultat cauchemardesque.

Les données naturelles sont donc une ressource finie. Un peu en désespoir de cause, OpenAI, le concepteur du célèbre ChatGPT, a lancé un appel aux collectivités et autres organismes détenteurs de grands ensembles de données. Ces derniers sont de plus en plus rares, donc de plus en plus précieux, et avec la grande pénurie qui s’annonce, c’est toute l’industrie de l’IA qui risque de connaître un ralentissement aussi brusque que son démarrage était explosif.

Source : The Conversation