El MLG Grok-1 se Vuelve Parcialmente de Código Abierto

Gábor Bíró 18 de marzo de 2024
3 min de lectura

En marzo de 2024, xAI anunció la apertura del código fuente de su modelo de lenguaje grande Grok-1, en línea con la intención declarada de Elon Musk de hacer que las tecnologías avanzadas de IA sean ampliamente accesibles y desafiar el enfoque cerrado de competidores como OpenAI.

El MLG Grok-1 se Vuelve Parcialmente de Código Abierto
Fuente:

Grok-1 es un modelo sustancial de 314 mil millones de parámetros de Modelo de Mezcla de Expertos (MoE) desarrollado desde cero por xAI. La arquitectura MoE significa que el modelo utiliza subredes especializadas ("expertos") y direcciona dinámicamente los tokens de entrada a los expertos más relevantes, lo que permite una mayor eficiencia en el entrenamiento y la inferencia en comparación con los modelos monolíticos de tamaño similar. La publicación de código abierto incluyó los pesos del modelo base y la arquitectura de red bajo la permisiva licencia Apache 2.0, que permite el uso comercial y la modificación con atribución.

Sin embargo, la publicación notablemente no incluyó los datos de entrenamiento ni el código de ajuste fino específico utilizado para crear el chatbot Grok disponible en la plataforma X (anteriormente Twitter). Esto significa que el Grok-1 de código abierto representa el punto de control del modelo base sin procesar y pre-entrenado (de octubre de 2023) y no replica directamente el comportamiento o las capacidades de acceso a información en tiempo real del chatbot ajustado integrado con X. Los archivos del modelo en sí son sustanciales, distribuidos a través de un enlace magnet que conduce a una descarga torrent de aproximadamente 300 GB.

Esta publicación fue significativa ya que puso a disposición del público uno de los modelos de lenguaje más grandes en ese momento, permitiendo a los investigadores estudiar su arquitectura y pesos. Sin embargo, la falta de detalles sobre el ajuste fino y los datos de entrenamiento limitó su usabilidad inmediata "lista para usar" para crear competidores directos de chatbots pulidos, lo que llevó a algunos a cuestionar el impacto práctico más allá de la investigación.

Esta medida encajaba con la crítica más amplia de Musk a empresas como OpenAI (que él cofundó pero luego abandonó), acusándolas de abandonar los principios iniciales de código abierto en la búsqueda de beneficios.

El Chatbot Grok y su Contexto de Mercado

El chatbot Grok, inicialmente impulsado por el modelo Grok-1, se lanzó para suscriptores de pago en X en noviembre de 2023. Fue diseñado para responder preguntas con "un poco de ingenio y un espíritu rebelde", aprovechando el acceso en tiempo real a la información de la plataforma X. Se posicionó como una alternativa a otros chatbots de IA como ChatGPT de OpenAI, ofreciendo una personalidad distinta y acceso a datos actualizados al minuto. Los benchmarks publicados por xAI mostraron que Grok-1 alcanzaba un rendimiento competitivo en diversas tareas, incluyendo una puntuación del 62.9% en el benchmark de matemáticas GSM8k.

Significado Estratégico de la Publicación Abierta de Grok-1

Al abrir el código fuente del modelo base Grok-1, xAI pretendía proporcionar un amplio acceso a la tecnología subyacente, contrastando con el acceso restringido ofrecido por muchos otros modelos de IA líderes. La publicación ganó prominencia en medio de las crecientes tensiones y disputas legales entre Musk y OpenAI, destacando la crítica continua de Musk a las empresas de IA que priorizan el beneficio sobre la seguridad y la transparencia.


Actualización (Abril de 2025):

Si bien la apertura del código fuente de Grok-1 en marzo de 2024 fue un evento notable, los desarrollos posteriores han aclarado el enfoque de xAI. Desde la publicación de Grok-1:

  • Grok-1.5 (anunciado en marzo de 2024) y Grok-1.5V (Visión, anunciado en abril de 2024) introdujeron capacidades mejoradas y multimodalidad, pero no se abrieron al código fuente. Se pusieron a disposición de los primeros testers y usuarios premium en X.
  • Grok-2 (anunciado en agosto de 2024), con mejoras adicionales y generación de imágenes, tampoco se abrió al código fuente, a pesar de algunas especulaciones o declaraciones anteriores que sugerían que las versiones previas podrían abrirse a medida que llegaran las nuevas.
  • Grok-3 (anunciado en febrero de 2025), la última iteración, sigue siendo propietario y es principalmente accesible a través de los niveles de suscripción de X.

Por lo tanto, a partir de ahora, solo los pesos y la arquitectura del modelo base Grok-1 original se han publicado bajo una licencia de código abierto. Los modelos más avanzados y ajustados de xAI siguen siendo cerrados y forman parte de su oferta comercial a través de la plataforma X, moderando las expectativas iniciales establecidas por la publicación de Grok-1 para una ruta de desarrollo totalmente abierta para sus modelos insignia.

Gábor Bíró 18 de marzo de 2024