OpenAI lanza GPT-4o mini: Alto rendimiento a una fracción del costo
GPT-4o mini logró una impresionante puntuación del 82% en la prueba de benchmark MMLU, superando a otros modelos pequeños de su clase. El modelo cuenta con una ventana de contexto de 128.000 tokens y admite capacidades de texto y visión, con planes de añadir funcionalidades de audio y vídeo en el futuro.

El precio del modelo es particularmente rentable: 0,15 dólares por millón de tokens de entrada y 0,60 dólares por millón de tokens de salida, lo que lo hace más de un 60% más barato que GPT-3.5 Turbo. Además, GPT-4o mini muestra mejoras significativas en la comprensión multilingüe, admitiendo numerosos idiomas además del inglés.
Especificaciones técnicas de GPT-4o mini
Las impresionantes especificaciones técnicas de GPT-4o mini lo posicionan como un modelo de IA potente y rentable. Aquí tienes una comparación de las características clave entre GPT-4o mini y otros modelos de OpenAI:
Característica | GPT-4o mini | GPT-3.5 Turbo | GPT-4o |
---|---|---|---|
Puntuación MMLU | 82% | 69,8% | 88,7% |
Ventana de contexto | 128.000 tokens | 16.000 tokens | 128.000 tokens |
Precio token de entrada | 0,15 $ / millón | 0,50 $ / millón | 5,00 $ / millón |
Precio token de salida | 0,60 $ / millón | 1,50 $ / millón | 15,00 $ / millón |
Modalidades | Texto, Visión | Texto | Texto, Visión, Audio |
Fecha límite de conocimiento | Octubre de 2023 | Septiembre de 2021 | Octubre de 2023 |
La multimodalidad completa de GPT-4o incluye audio, aunque las características de la API pueden variar.
Capacidades y aplicaciones
GPT-4o mini supera a GPT-3.5 Turbo en inteligencia textual y razonamiento multimodal, al tiempo que ofrece una ventana de contexto sustancialmente mayor. Iguala el tamaño de la ventana de contexto y la fecha límite de conocimiento del emblemático GPT-4o, pero a una fracción del precio. El modelo admite entradas de texto y visión, con planes futuros para incorporar capacidades de audio y vídeo, lo que lo convierte en una opción versátil para los desarrolladores. Su comprensión multilingüe mejorada amplía aún más su utilidad en diversas aplicaciones y mercados.
Accesibilidad e integración
GPT-4o mini está disponible de inmediato en el conjunto de API de OpenAI, incluidas la API de Assistants, la API de Chat Completions y la API de Batch. El modelo comenzó a implementarse para usuarios gratuitos y de pago de ChatGPT (incluidos los suscriptores Plus y Team) el 18 de julio de 2024. Se esperaba que los usuarios empresariales obtuvieran acceso la semana siguiente. El modelo también se está integrando en la plataforma Microsoft Azure AI, lo que permite a los clientes aprovechar sus capacidades para diversas aplicaciones, incluido el procesamiento de audio, visión y texto.
Ventaja competitiva e impacto
GPT-4o mini entra en un panorama competitivo como un fuerte contendiente frente a otros modelos de IA pequeños. Supera a Claude 3 Haiku de Anthropic en el benchmark de razonamiento multimodal (MMMU), obteniendo una puntuación del 59,4% en comparación con el 50,2% de Haiku. GPT-4o mini también funciona mejor que Gemini Flash de Google en el benchmark MMMU (59,4% frente a 56,1%). En términos de inteligencia general, la puntuación del 82% de GPT-4o mini en el benchmark MMLU también es notable, superando significativamente el 69,8% de GPT-3.5 Turbo. Este rendimiento, combinado con su precio sustancialmente más bajo y su ventana de contexto ampliada, convierte a GPT-4o mini en una opción muy competitiva para desarrolladores y empresas que buscan soluciones de IA rentables y de alto rendimiento.
Perspectivas de futuro
GPT-4o mini está preparado para tener un impacto significativo en el campo de la IA al hacer que los modelos de lenguaje avanzados sean más accesibles y asequibles. Se espera que su rentabilidad y su rendimiento mejorado impulsen una adopción más amplia en diversas industrias y aplicaciones. OpenAI prevé que los modelos de IA se integren perfectamente en todas las aplicaciones y sitios web, y GPT-4o mini allana el camino para que los desarrolladores construyan y escalen aplicaciones de IA potentes de forma más eficiente. La empresa sigue comprometida con la reducción de costes y la mejora de las capacidades de los modelos, habiendo logrado ya una reducción del 99% en el coste por token desde el lanzamiento de text-davinci-003 en 2022. A medida que GPT-4o mini se adopte más ampliamente, es probable que estimule la innovación en áreas como la atención al cliente, la generación de contenidos y el análisis de datos, transformando potencialmente la forma en que las empresas y los particulares interactúan con la tecnología de la IA.