Intelligence artificielle

OpenAI lance GPT-4o mini : Performances élevées à prix réduit

Gábor Bíró • 22 juillet 2024

3 min de lecture

GPT-4o mini a réalisé un score remarquable de 82% au test de référence MMLU, surpassant les autres petits modèles de sa catégorie. Ce modèle se distingue par une fenêtre contextuelle de 128 000 jetons et prend en charge les fonctionnalités de texte et de vision, avec l'ajout prévu des capacités audio et vidéo.

Le prix du modèle est particulièrement avantageux : 0,15 $ par million de jetons d'entrée et 0,60 $ par million de jetons de sortie, ce qui le rend plus de 60 % moins cher que GPT-3.5 Turbo. De plus, GPT-4o mini présente des améliorations significatives en matière de compréhension multilingue, prenant en charge de nombreuses langues autres que l'anglais.

Spécifications techniques de GPT-4o mini

Les spécifications techniques impressionnantes de GPT-4o mini le positionnent comme un modèle d'IA puissant et pourtant économique. Voici une comparaison des principales caractéristiques entre GPT-4o mini et d'autres modèles OpenAI :

Caractéristique	GPT-4o mini	GPT-3.5 Turbo	GPT-4o
Score MMLU	82%	69.8%	88.7%
Fenêtre contextuelle	128,000 tokens	16,000 tokens	128,000 tokens
Prix des jetons d'entrée	$0.15 / million	$0.50 / million	$5.00 / million
Prix des jetons de sortie	$0.60 / million	$1.50 / million	$15.00 / million
Modalités	Texte, Vision	Texte	Texte, Vision, Audio
Date limite de connaissances	Octobre 2023	Septembre 2021	Octobre 2023

La multimodalité complète de GPT-4o inclut l'audio, bien que les fonctionnalités de l'API puissent varier.

Capacités et applications

GPT-4o mini surpasse GPT-3.5 Turbo en intelligence textuelle et en raisonnement multimodal tout en offrant une fenêtre contextuelle considérablement plus grande. Il égale la taille de la fenêtre contextuelle et la date limite de connaissances du modèle phare GPT-4o, mais à une fraction du prix. Le modèle prend en charge les entrées de texte et de vision, avec des plans futurs pour intégrer les capacités audio et vidéo, ce qui en fait une option polyvalente pour les développeurs. Sa compréhension multilingue améliorée élargit encore son utilité dans diverses applications et marchés.

Accessibilité et intégration

GPT-4o mini est immédiatement disponible dans la suite d'API OpenAI, y compris l'API Assistants, l'API Chat Completions et l'API Batch. Le déploiement du modèle a commencé pour les utilisateurs gratuits et payants de ChatGPT (y compris les abonnés Plus et Team) le 18 juillet 2024. Les utilisateurs Enterprise devraient y accéder la semaine suivante. Le modèle est également en cours d'intégration dans la plateforme Microsoft Azure AI, permettant aux clients de tirer parti de ses capacités pour diverses applications, notamment le traitement audio, visuel et textuel.

Avantage concurrentiel et impacts

GPT-4o mini entre dans un paysage concurrentiel en tant que concurrent sérieux face à d'autres petits modèles d'IA. Il surpasse Claude 3 Haiku d'Anthropic au benchmark de raisonnement multimodal (MMMU), avec un score de 59,4 % contre 50,2 % pour Haiku. GPT-4o mini est également plus performant que Gemini Flash de Google au benchmark MMMU (59,4 % contre 56,1 %). En termes d'intelligence générale, le score de 82 % de GPT-4o mini au benchmark MMLU est également notable, surpassant significativement les 69,8 % de GPT-3.5 Turbo. Ces performances, combinées à son prix nettement inférieur et à sa fenêtre contextuelle élargie, font de GPT-4o mini une option très compétitive pour les développeurs et les entreprises recherchant des solutions d'IA rentables et performantes.

Perspectives d'avenir

GPT-4o mini est sur le point d'avoir un impact significatif sur le domaine de l'IA en rendant les modèles de langage avancés plus accessibles et abordables. Son rapport qualité-prix et ses performances améliorées devraient stimuler une adoption plus large dans divers secteurs et applications. OpenAI envisage des modèles d'IA s'intégrant de manière transparente dans chaque application et site web, et GPT-4o mini ouvre la voie aux développeurs pour créer et faire évoluer plus efficacement des applications d'IA puissantes. L'entreprise reste déterminée à réduire davantage les coûts tout en améliorant les capacités des modèles, ayant déjà réalisé une réduction de 99 % du coût par jeton depuis le lancement de text-davinci-003 en 2022. À mesure que GPT-4o mini sera plus largement adopté, il est probable qu'il stimulera l'innovation dans des domaines tels que le service client, la génération de contenu et l'analyse de données, transformant potentiellement la façon dont les entreprises et les particuliers interagissent avec la technologie de l'IA.