OpenAI a présenté GPT-4o mini, une version compacte de son modèle de langage de pointe. Lancée jeudi, cette nouvelle offre vise à fournir une solution plus accessible et plus rentable pour les développeurs et les consommateurs.

Ça y est, OpenAI va afin remplacer l’actuel modèle GPT-3.5 des utilisateurs gratuits par un tout nouveau : GPT-4o mini. Le modèle est déjà disponible via l'application web et mobile ChatGPT, et les utilisateurs professionnels y auront accès la semaine prochaine.

GPT-4o mini représente un changement stratégique dans l'approche d'OpenAI, qui se concentre sur la création de modèles plus petits et plus efficaces sans compromettre les performances. Selon l'entreprise, ce nouveau modèle surpasse les autres petits modèles d'IA de pointe dans les tâches de raisonnement impliquant à la fois du texte et de la vision.

Quelles nouveautés pour GPT-4o mini ?

L'un des aspects les plus convaincants du GPT-4o mini est sa structure de prix. OpenAI affirme que son fonctionnement est plus de 60 % moins cher que celui de son prédécesseur, GPT-3.5 Turbo. Pour les développeurs qui utilisent l'API d'OpenAI, le prix de GPT-4o mini est de 15 cents par million de jetons d'entrée et de 60 cents par million de jetons de sortie. Cette réduction significative des coûts pourrait donc démocratiser l'accès aux capacités avancées de l'IA, ce qui pourrait stimuler l'innovation dans diverses industries.

Les capacités du modèle sont pourtant impressionnantes, avec une fenêtre contextuelle de 128 000 jetons, soit à peu près l'équivalent de la longueur d'un livre, et une date limite de connaissance fixée à octobre 2023. OpenAI n'a pas révélé la taille exacte de GPT-4o mini, mais a indiqué qu'il était comparable à d'autres petits modèles d'IA tels que Llama 3 8b, Claude Haiku et Gemini 1.5 Flash. Cependant, l'entreprise affirme que son offre est plus rapide, plus rentable et plus intelligente que celle de ces concurrents.

Les premiers tests indépendants semblent confirmer les affirmations d'OpenAI. George Cameron, cofondateur d'Artificial Analysis, a noté que GPT-4o mini affiche une vitesse de sortie médiane de 202 jetons par seconde, soit plus de deux fois la vitesse de GPT-4o et de GPT-3.5 Turbo. Cet avantage en termes de vitesse pourrait changer la donne pour les applications nécessitant des temps de réponse rapides.

À l'avenir, OpenAI a des projets ambitieux pour GPT-4o mini. L'entreprise a l'intention d'étendre ses capacités au traitement vidéo et audio à l'avenir, afin d'améliorer encore sa polyvalence. En outre, OpenAI introduit une nouvelle technique appelée “hiérarchie des instructions”, qui vise à rendre le modèle plus résistant aux attaques par injection rapide et aux jailbreaks.