OpenAI lance le modèle o1 pour améliorer les capacités de raisonnement de l'IA

Gábor Bíró • 13 septembre 2024

3 min de lecture

Le dernier modèle d'intelligence artificielle d'OpenAI, o1 (nom de code interne "Strawberry"), est désormais disponible. Le modèle o1 est spécifiquement conçu pour améliorer les capacités de raisonnement de l'intelligence artificielle. Diverses sources indiquent que cette nouvelle famille de modèles vise à résoudre des problèmes complexes en science, programmation et mathématiques en passant plus de temps à "réfléchir" avant de fournir une réponse.

OpenAI lance le modèle o1 pour améliorer les capacités de raisonnement de l'IA

Source: Création originale

Raisonnement avancé et performances

Le modèle o1 a démontré des capacités remarquables en résolution de problèmes complexes, en particulier dans les domaines STEM (Science, Technologie, Ingénierie et Mathématiques). Lors de tests, o1 s'est classé dans le 89e percentile des concours de programmation compétitive (Codeforces) et parmi les 500 meilleurs étudiants au concours de qualification des Olympiades mathématiques américaines (AIME). Dans des domaines scientifiques tels que la physique, la biologie et la chimie, il a surpassé la précision humaine au niveau doctorat sur un ensemble de données de référence (GPQA). Son raisonnement avancé permet à o1 de s'attaquer à des questions complexes, de générer des algorithmes sophistiqués et d'exceller dans des tâches d'analyse comparative, telles que l'examen de contrats ou de documents juridiques.

Benchmarks de performance

Le modèle o1 a affiché des performances exceptionnelles dans divers benchmarks, prouvant ses compétences avancées en raisonnement. Le tableau ci-dessous résume les principaux résultats du modèle o1 :

Benchmark	Performance
Codeforces (Programmation compétitive)	89e percentile
AIME (Concours de qualification des Olympiades mathématiques)	Top 500 étudiants aux USA
GPQA (Physique, Biologie, Chimie)	Surpasse la précision au niveau doctorat
Olympiade internationale d'informatique (IOI)	49e percentile mondial
Classement Elo Codeforces	1807 (93e percentile)
Sous-catégories MMLU	Surpasse les modèles précédents dans 54 sur 57

Les performances du modèle o1 sont particulièrement remarquables dans les domaines STEM, démontrant sa capacité à résoudre des problèmes complexes et à travailler logiquement sur des tâches difficiles. Ses résultats élèvent les capacités de raisonnement de l'IA à un nouveau niveau, représentant une avancée significative pour les applications en science, mathématiques et programmation.

Variantes du modèle o1

Le modèle o1 a été publié en deux variantes : o1-preview et o1-mini. o1-mini est plus petit, plus rapide et plus économique, spécifiquement conçu pour les tâches de codage. o1-mini serait 80 % moins cher que o1-preview tout en offrant des performances compétitives élevées sur les benchmarks de codage. Les deux modèles sont accessibles dans ChatGPT et via l'API OpenAI.

Limitations et défis

Malgré ses capacités avancées, le modèle o1 fait face à plusieurs défis. Son utilisation est nettement plus coûteuse, avec des coûts d'entrée 3x et des coûts de sortie 4x plus élevés que GPT-4o via l'API. Le modèle o1 peut parfois être plus lent dans le traitement des requêtes, en particulier pour les problèmes complexes qui peuvent nécessiter plus de dix secondes de temps de calcul. Une autre limitation est que o1 ne prend actuellement pas en charge des fonctionnalités telles que la navigation web et l'analyse de fichiers, qui sont disponibles dans d'autres modèles d'IA.

Disponibilité et plans futurs

Le modèle o1 est actuellement disponible pour les utilisateurs de ChatGPT Plus et Team, avec des limites hebdomadaires de messages : 30 messages pour o1-preview et 50 messages pour o1-mini. Le modèle o1-mini devrait bientôt être disponible pour tous les utilisateurs gratuits de ChatGPT, bien qu'aucune date de sortie spécifique n'ait encore été annoncée. OpenAI prévoit d'améliorer encore les capacités du modèle, de résoudre ses limitations et d'intégrer des fonctionnalités supplémentaires telles que la navigation et le téléchargement de fichiers afin d'accroître son utilité dans diverses applications.

Recommandé

Intrication quantique dans le cerveau : un lien avec la conscience ?

8 août 2024 • 4 min de lecture

Ces dernières années, la question s'est de plus en plus posée : le monde mystérieux de la physique quantique pourrait-il influencer le fonctionnement du cerveau humain et notre conscience ? Le concept d'intrication quantique, où les particules deviennent interconnectées et interagissent, divise la communauté scientifique. Pourquoi cela importe-t-il, au-delà du simple désir de comprendre comment fonctionne notre cerveau ?

Amazon Améliore l'Efficacité de ses Entrepôts avec Plus de 750 000 Robots

29 avril 2024 • 2 min de lecture

Amazon a considérablement augmenté son utilisation de la robotique, employant désormais plus de 750 000 robots à travers son réseau mondial. Grâce à ceux-ci, l'entreprise vise à améliorer l'efficacité, la sécurité et la rapidité de divers flux de travail d'entrepôt et processus de livraison.

Les limites de notre cerveau tribal dans un monde moderne

30 juin 2025 • 10 min de lecture

Combien d'amis avez-vous réellement ? Le nombre de vos connexions Facebook peut se compter par centaines, voire par milliers, mais avec combien de personnes entretenez-vous une relation véritablement profonde et significative ?

Réinterprétation de l'expérience du marshmallow

7 septembre 2024 • 4 min de lecture

L'une des études les plus célèbres et influentes de l'histoire de la psychologie est sans aucun doute l'expérience du marshmallow de Stanford. Menée par Walter Mischel et ses collègues dans les années 1960, cette recherche a façonné notre façon de penser la maîtrise de soi et ses effets à long terme pendant des décennies. Mais le tableau est-il vraiment aussi simple qu'on le pensait autrefois ?

L'ordre dans l'imprévisible

20 mai 2025 • 5 min de lecture

Pourquoi est-il si difficile de prévoir la météo plus d'une semaine à l'avance ? Pourquoi un changement minime dans un système peut-il entraîner un résultat radicalement différent ? Ce sont les types de questions qui ont mené au développement de l'un des domaines les plus fascinants de la science moderne : la théorie du chaos.

Usines et entrepôts automatisés

21 août 2024 • 5 min de lecture

Depuis des décennies, les secteurs de la fabrication et de la logistique évoquent l'avènement d'usines et d'entrepôts entièrement automatisés, où la production et la manutention sont gérées par des robots et des machines intelligentes très avancés avec une intervention humaine minimale. Ces installations peuvent fonctionner même dans l'obscurité totale, d'où le terme « usine sans lumière ».

L'IA ne peut pas détenir de droits de brevet

13 février 2024 • 3 min de lecture

L'intelligence artificielle (IA) ne peut pas être légalement reconnue comme un "inventeur" sur les demandes de brevet aux États-Unis, une position confirmée par la Cour d'appel américaine pour le circuit fédéral et renforcée par les directives de l'Office américain des brevets et des marques de commerce (USPTO). Cette position affirme qu'en vertu du droit américain actuel, seuls les êtres humains peuvent être qualifiés pour la qualité d'inventeur.