Inteligencia artificial

OpenAI lanza GPT-4o mini: Alto rendimiento a una fracción del costo

Gábor Bíró • 22 de julio de 2024

3 min de lectura

GPT-4o mini logró una impresionante puntuación del 82% en la prueba de benchmark MMLU, superando a otros modelos pequeños de su clase. El modelo cuenta con una ventana de contexto de 128.000 tokens y admite capacidades de texto y visión, con planes de añadir funcionalidades de audio y vídeo en el futuro.

El precio del modelo es particularmente rentable: 0,15 dólares por millón de tokens de entrada y 0,60 dólares por millón de tokens de salida, lo que lo hace más de un 60% más barato que GPT-3.5 Turbo. Además, GPT-4o mini muestra mejoras significativas en la comprensión multilingüe, admitiendo numerosos idiomas además del inglés.

Especificaciones técnicas de GPT-4o mini

Las impresionantes especificaciones técnicas de GPT-4o mini lo posicionan como un modelo de IA potente y rentable. Aquí tienes una comparación de las características clave entre GPT-4o mini y otros modelos de OpenAI:

Característica	GPT-4o mini	GPT-3.5 Turbo	GPT-4o
Puntuación MMLU	82%	69,8%	88,7%
Ventana de contexto	128.000 tokens	16.000 tokens	128.000 tokens
Precio token de entrada	0,15 $ / millón	0,50 $ / millón	5,00 $ / millón
Precio token de salida	0,60 $ / millón	1,50 $ / millón	15,00 $ / millón
Modalidades	Texto, Visión	Texto	Texto, Visión, Audio
Fecha límite de conocimiento	Octubre de 2023	Septiembre de 2021	Octubre de 2023

La multimodalidad completa de GPT-4o incluye audio, aunque las características de la API pueden variar.

Capacidades y aplicaciones

GPT-4o mini supera a GPT-3.5 Turbo en inteligencia textual y razonamiento multimodal, al tiempo que ofrece una ventana de contexto sustancialmente mayor. Iguala el tamaño de la ventana de contexto y la fecha límite de conocimiento del emblemático GPT-4o, pero a una fracción del precio. El modelo admite entradas de texto y visión, con planes futuros para incorporar capacidades de audio y vídeo, lo que lo convierte en una opción versátil para los desarrolladores. Su comprensión multilingüe mejorada amplía aún más su utilidad en diversas aplicaciones y mercados.

Accesibilidad e integración

GPT-4o mini está disponible de inmediato en el conjunto de API de OpenAI, incluidas la API de Assistants, la API de Chat Completions y la API de Batch. El modelo comenzó a implementarse para usuarios gratuitos y de pago de ChatGPT (incluidos los suscriptores Plus y Team) el 18 de julio de 2024. Se esperaba que los usuarios empresariales obtuvieran acceso la semana siguiente. El modelo también se está integrando en la plataforma Microsoft Azure AI, lo que permite a los clientes aprovechar sus capacidades para diversas aplicaciones, incluido el procesamiento de audio, visión y texto.

Ventaja competitiva e impacto

GPT-4o mini entra en un panorama competitivo como un fuerte contendiente frente a otros modelos de IA pequeños. Supera a Claude 3 Haiku de Anthropic en el benchmark de razonamiento multimodal (MMMU), obteniendo una puntuación del 59,4% en comparación con el 50,2% de Haiku. GPT-4o mini también funciona mejor que Gemini Flash de Google en el benchmark MMMU (59,4% frente a 56,1%). En términos de inteligencia general, la puntuación del 82% de GPT-4o mini en el benchmark MMLU también es notable, superando significativamente el 69,8% de GPT-3.5 Turbo. Este rendimiento, combinado con su precio sustancialmente más bajo y su ventana de contexto ampliada, convierte a GPT-4o mini en una opción muy competitiva para desarrolladores y empresas que buscan soluciones de IA rentables y de alto rendimiento.

Perspectivas de futuro

GPT-4o mini está preparado para tener un impacto significativo en el campo de la IA al hacer que los modelos de lenguaje avanzados sean más accesibles y asequibles. Se espera que su rentabilidad y su rendimiento mejorado impulsen una adopción más amplia en diversas industrias y aplicaciones. OpenAI prevé que los modelos de IA se integren perfectamente en todas las aplicaciones y sitios web, y GPT-4o mini allana el camino para que los desarrolladores construyan y escalen aplicaciones de IA potentes de forma más eficiente. La empresa sigue comprometida con la reducción de costes y la mejora de las capacidades de los modelos, habiendo logrado ya una reducción del 99% en el coste por token desde el lanzamiento de text-davinci-003 en 2022. A medida que GPT-4o mini se adopte más ampliamente, es probable que estimule la innovación en áreas como la atención al cliente, la generación de contenidos y el análisis de datos, transformando potencialmente la forma en que las empresas y los particulares interactúan con la tecnología de la IA.