xAI lance Grok-2 sur X

Gábor Bíró 17 août 2024
2 min de lecture

Le dernier grand modèle linguistique (LLM) de xAI, Grok-2, a récemment commencé à être déployé pour les abonnés X Premium, suscitant d'importantes discussions en ligne. Cette version améliorée de l'assistant IA se vante de plusieurs nouvelles capacités, notamment un chat, un codage et un raisonnement logique améliorés. Parallèlement au LLM, xAI a également introduit des fonctionnalités de génération d'images, qui ont suscité des inquiétudes particulières en raison de leur nature moins restrictive.

xAI lance Grok-2 sur X
Source:

Quoi de neuf avec Grok-2 ?

Grok-2 représente une avancée substantielle dans le traitement du langage naturel, la résolution de problèmes et le raisonnement complexe par rapport à son prédécesseur. Les principales capacités comprennent :

  • Compétences conversationnelles avancées : Plus efficace à la fois dans les conversations informelles et la communication professionnelle, affichant souvent le ton spirituel ou rebelle caractéristique de Grok.
  • Forte compétence en codage : Démontre des compétences dans un large éventail de langages et de frameworks de programmation.
  • Résolution de problèmes améliorée : Capable de s'attaquer à des tâches logiques et analytiques complexes.
  • Intégration d'informations en temps réel : Exploite les données actualisées de la plateforme X pour éclairer ses réponses, un élément différenciateur clé pour le modèle.
  • Capacités de vision : Grok-2 montre également de fortes performances dans la compréhension des informations visuelles, comme les documents et les diagrammes.

Parallèlement au modèle principal, xAI a également publié Grok-2 mini, une version plus légère conçue pour des temps de réponse plus rapides tout en visant à maintenir la précision, adaptée aux utilisateurs privilégiant l'efficacité.

Controverse et préoccupations éthiques autour de la génération d'images

Bien que Grok-2 soit lui-même un modèle linguistique, xAI a simultanément déployé des capacités de génération d'images sur la plateforme X. Cette fonctionnalité a suscité une controverse considérable car ses filtres de contenu semblent nettement moins restrictifs que ceux de concurrents comme DALL-E, Gemini ou Midjourney. Les utilisateurs ont rapidement découvert qu'il pouvait générer des images de personnalités politiques, de personnages protégés par le droit d'auteur et d'autres contenus potentiellement sensibles ou trompeurs avec moins de protections. Cela soulève des inquiétudes quant à la propagation potentielle de désinformation, en particulier en période de sensibilité politique, et à l'utilisation abusive de l'IA pour créer des deepfakes ou des contenus illicites.

Performances et concurrence

Grok-2 a montré de fortes performances dans plusieurs benchmarks, surpassant notamment GPT-4 dans des tests de raisonnement complexe comme MMLU-Pro (mesurant les connaissances multidisciplinaires) et GPQA (évaluant la capacité à répondre à des questions de niveau supérieur). Cependant, dans d'autres domaines, tels que les benchmarks de mathématiques et de codage, des modèles comme la série GPT-4 d'OpenAI et Claude 3.5 Sonnet d'Anthropic conservent toujours un avantage concurrentiel.

Disponibilité et plans futurs

Initialement, l'accès à Grok-2 et Grok-2 mini sur X était principalement destiné aux abonnés X Premium et Premium+, bien que des options d'accès plus larges soient devenues disponibles par la suite. xAI a également rendu les modèles disponibles via une API d'entreprise pour les développeurs. Sur la base des commentaires des utilisateurs, xAI continue d'affiner les modèles.

Pour l'avenir, xAI prévoit de lancer Grok-3, qui aurait été entraîné sur un cluster massif de potentiellement plus de 100 000 GPU Nvidia H100. Cela signale une concurrence intense avec les prochains modèles de nouvelle génération comme GPT-5. Bien que Grok-2 soit une étape prometteuse, le paysage de l'IA reste très compétitif, avec un développement continu nécessaire pour égaler ou surpasser ses rivaux dans tous les domaines.

Gábor Bíró 17 août 2024