Modelos OpenELM de Apple Diseñados para Ejecutarse en el Dispositivo, No Solo en la Nube

Gábor Bíró • 26 de abril de 2024

4 min de lectura

Apple ha presentado OpenELM (Modelos de Lenguaje Eficientes y Abiertos), una nueva familia de modelos de lenguaje grandes de código abierto diseñados específicamente para ejecutarse localmente en dispositivos como iPhones y iPads. Esto representa un cambio significativo con respecto a la gran dependencia del procesamiento en servidores basados en la nube, típico en la mayoría de los modelos de IA potentes actuales. Si bien Apple fue pionera en la aceleración de la IA en el dispositivo con su Neural Engine, ha sido menos visible en el espacio de los grandes modelos generativos dominado por los servicios en la nube. Este desarrollo es una parte clave de la estrategia más amplia de Apple para integrar capacidades de IA más avanzadas directamente en su hardware, con el objetivo de mejorar la privacidad del usuario, reducir la latencia y habilitar la funcionalidad sin conexión.

Modelos OpenELM de Apple Diseñados para Ejecutarse en el Dispositivo, No Solo en la Nube

El Desafío de la IA en el Dispositivo

Ejecutar Modelos de Lenguaje Grandes (LLM) sofisticados directamente en dispositivos de consumo presenta considerables obstáculos técnicos. Los LLM modernos a menudo contienen miles de millones, a veces billones, de parámetros: las variables que el modelo aprende durante el entrenamiento. Procesar estos modelos requiere una inmensa potencia computacional (multiplicaciones de matrices complejas) y grandes cantidades de memoria (RAM) solo para cargar los pesos del modelo. Los servidores en la nube tienen acceso a potentes GPU y recursos virtualmente ilimitados, pero los dispositivos móviles operan bajo estrictas limitaciones:

RAM Limitada: Los teléfonos inteligentes tienen significativamente menos memoria que los servidores.
Potencia de Procesamiento Limitada: Si bien las CPU, GPU y Unidades de Procesamiento Neuronal (NPU como el Neural Engine de Apple) móviles son potentes, no igualan el hardware de servidor dedicado.
Duración de la Batería: Los cálculos intensivos agotan la batería rápidamente.
Límites Térmicos: Los dispositivos pueden sobrecalentarse bajo cargas de procesamiento pesado sostenido.

Debido a estas limitaciones, ejecutar un LLM verdaderamente "inteligente" capaz de razonamiento complejo y generación directamente en un teléfono es extremadamente difícil. Requiere concesiones en el tamaño y la capacidad del modelo. Esta es precisamente la razón por la que el desarrollo de modelos eficientes como OpenELM, que están optimizados para el rendimiento dentro de las limitaciones de recursos, es crucial para el futuro de la IA en el dispositivo.

Descripción General de OpenELM: La Eficiencia es Clave

Los modelos OpenELM emplean una estrategia de escalado por capas, que asigna eficientemente los parámetros dentro de cada capa de la arquitectura transformer para maximizar la precisión para un presupuesto computacional dado. Por ejemplo, dentro de aproximadamente un presupuesto de mil millones de parámetros, Apple informa que OpenELM logró una mejora del 2.36% en la precisión en comparación con el modelo OLMo anterior, crucialmente mientras requería solo la mitad de los tokens de pre-entrenamiento (datos). Esta eficiencia es primordial: lograr mejores resultados con menos recursos hace que estos modelos sean más viables para ejecutarse directamente en hardware de consumo sin agotar excesivamente la batería o ralentizar el dispositivo. Apple ha lanzado OpenELM en varios tamaños (270M, 450M, 1.1B y 3B parámetros), lo que permite a los desarrolladores elegir el que mejor se adapte a las capacidades del dispositivo de destino.

Características y Capacidades

El proyecto OpenELM incluye varios elementos clave que lo distinguen:

Disponibilidad de Código Abierto: En un movimiento notable para la empresa en el espacio de la IA, Apple está haciendo que OpenELM esté disponible en Hugging Face Hub. Esto permite a los desarrolladores e investigadores acceder no solo para usar los modelos, sino también para examinarlos, desarrollarlos y contribuir a su desarrollo. Esta estrategia podría ayudar a Apple a acelerar el progreso y atraer talento en el competitivo panorama de la IA.
Marco de Entrenamiento Integral: A diferencia de muchos lanzamientos de modelos que solo proporcionan pesos del modelo y código de inferencia, Apple incluye el marco completo para el entrenamiento y la evaluación en conjuntos de datos disponibles públicamente. Esto abarca registros de entrenamiento, múltiples puntos de control y configuraciones de pre-entrenamiento, lo que aumenta significativamente la transparencia y la reproducibilidad.
Privacidad y Velocidad Mejoradas: Al ejecutarse localmente en el dispositivo, OpenELM elimina la necesidad de enviar datos de usuario potencialmente sensibles a servidores en la nube para su procesamiento, abordando directamente las preocupaciones de privacidad, un principio fundamental de la marca Apple. Además, el procesamiento local reduce la latencia de la red, lo que resulta en funciones impulsadas por IA más rápidas y receptivas.

Integración con iOS y Perspectivas Futuras

Se espera que Apple integre OpenELM en la próxima versión de iOS 18, que se prevé que introduzca una gama de nuevas funciones de IA. Es probable que esta integración impulse varias funciones de IA en el dispositivo. Sin embargo, es importante establecer expectativas realistas: estos modelos eficientes, particularmente las variantes más pequeñas, probablemente no igualarán las amplias capacidades de razonamiento de los gigantescos modelos basados en la nube como GPT-4. En cambio, se adaptan mejor a tareas específicas y localizadas, como el resumen de texto inteligente, la mejora del texto predictivo, las mejoras de Siri sin conexión, el análisis de contenido en el dispositivo (como fotos o notas) y la generación de respuestas contextuales.

Es posible que Apple adopte un enfoque híbrido, utilizando OpenELM para tareas que se benefician más de la velocidad y la privacidad en el dispositivo, mientras que potencialmente confía en modelos basados en la nube (quizás incluso de socios) para consultas más complejas. En general, el lanzamiento de los modelos OpenELM marca un paso significativo en el avance de la IA en el dispositivo. Al enfatizar la eficiencia, la privacidad y adoptar un enfoque de código abierto, Apple se está posicionando para desempeñar un papel más destacado en la próxima generación de IA integrada directamente en dispositivos móviles y de consumo, aprovechando su ecosistema de hardware y software estrechamente integrado.

Recomendados

Investigadores de Google Simulan una Sopa Primordial Digital

27 de julio de 2024 • 3 min de lectura

Investigadores de Google han simulado la emergencia de formas de vida digital autorreplicantes en un experimento que podría ofrecer información sobre cómo comenzó la vida biológica en la Tierra. Según New Scientist, el estudio consistió en crear una "sopa primordial" virtual donde datos aleatorios interactuaron durante millones de generaciones, lo que llevó a la formación espontánea de programas autorreplicantes.

¿Obtenemos mejores respuestas al consultar modelos en inglés?

30 de diciembre de 2024 • 7 min de lectura

Al usar Modelos de Lenguaje Extensos (LLM) como GPT-4o o Claude Sonnet, surge una pregunta común, especialmente para la gran cantidad de usuarios en todo el mundo que interactúan con estas herramientas en idiomas distintos al inglés: ¿qué idioma se debe usar para lograr los resultados más efectivos? Si bien las capacidades multilingües de estos modelos permiten una comunicación efectiva en numerosos idiomas, su rendimiento a menudo parece disminuir en comparación con las interacciones realizadas puramente en inglés. Esta exploración profundiza en por qué podría ser este el caso y cuándo cambiar al inglés podría ser beneficioso.

¿Cómo está la Inteligencia Artificial Transformando la Agricultura?

5 de agosto de 2024 • 8 min de lectura

La agricultura se encuentra en la cúspide de una revolución tecnológica, con la Inteligencia Artificial (IA) a la vanguardia de esta transformación. La IA está revolucionando el sector agrícola, ofreciendo nuevas soluciones para aumentar la productividad, optimizar el uso de recursos y abordar desafíos como la escasez de mano de obra y la sostenibilidad. Al integrar el aprendizaje automático, la robótica y el análisis de datos, la IA no solo mejora la eficiencia de las prácticas agrícolas, sino que también promete un futuro más sostenible y rentable para la producción de alimentos.

La Singularidad de la IA

23 de abril de 2025 • 8 min de lectura

El término "Singularidad" ha trascendido el discurso científico de nicho para convertirse en un motivo recurrente en la cultura popular, apareciendo de forma destacada en películas, artículos de noticias y debates públicos. A menudo representado con dramatismo, evoca imágenes de inteligencia artificial descontrolada y una existencia humana fundamentalmente alterada. Aunque a veces se sensacionaliza, el concepto subyacente merece una seria consideración, especialmente a medida que los avances en Inteligencia Artificial (IA) se aceleran.

El Efecto Cobra

8 de octubre de 2024 • 4 min de lectura

El Efecto Cobra describe las consecuencias negativas no intencionadas de políticas bien intencionadas, ilustrado famosamente por un intento de controlar cobras. Este fenómeno destaca cómo las soluciones excesivamente simplistas y los incentivos mal diseñados pueden empeorar inadvertidamente el problema que intentan resolver.

Notación Polaca Inversa: Una Alternativa Elegante para Evaluar Expresiones Matemáticas

2 de marzo de 2025 • 6 min de lectura

La Notación Polaca Inversa (NPI) es un método eficiente para evaluar expresiones matemáticas, que se caracteriza por colocar los operadores después de sus operandos. Este enfoque permite omitir los paréntesis, simplificando y clarificando el proceso de cálculo. Aunque al principio pueda parecer diferente, usar la NPI acelera significativamente la ejecución de operaciones, especialmente en sistemas informáticos y calculadoras programables.

El valle inquietante: cuando los robots se vuelven demasiado humanos

11 de marzo de 2025 • 8 min de lectura

¿Alguna vez has visto un robot, una figura animada o incluso un personaje de videojuego tan realista que te ha resultado casi... inquietante? ¿Te costó distinguir si era humano o no, y esta incertidumbre te generó una sensación extraña e inquietante? Si es así, es probable que hayas experimentado el fenómeno conocido como el "valle inquietante". Pero, ¿qué es exactamente y por qué desencadena una reacción tan fuerte en nosotros?