xAI запускает Grok-2 на платформе X

Gábor Bíró 17 августа 2024 г.
2 мин. чтения

Новейшая большая языковая модель (LLM) от xAI, Grok-2, недавно начала развертывание для подписчиков X Premium, вызвав значительные дискуссии в сети. Эта улучшенная версия AI-ассистента обладает рядом новых возможностей, включая улучшенный чат, кодирование и логическое мышление. Наряду с LLM, xAI также представила функции генерации изображений, которые вызвали особое беспокойство из-за своей менее строгой природы.

xAI запускает Grok-2 на платформе X
Источник:

Что нового в Grok-2?

Grok-2 представляет собой значительный шаг вперед в обработке естественного языка, решении проблем и сложном рассуждении по сравнению со своим предшественником. Ключевые возможности включают:

  • Продвинутые навыки общения: Более эффективен как в непринужденном общении, так и в профессиональной коммуникации, часто демонстрируя фирменный остроумный или бунтарский тон Grok.
  • Высокий уровень владения кодированием: Демонстрирует компетентность в широком спектре языков программирования и фреймворков.
  • Улучшенное решение проблем: Способен решать сложные логические и аналитические задачи.
  • Интеграция информации в реальном времени: Использует самые свежие данные с платформы X для информирования своих ответов, что является ключевым отличием модели.
  • Возможности компьютерного зрения: Grok-2 также демонстрирует высокие результаты в понимании визуальной информации, такой как документы и диаграммы.

Наряду с основной моделью, xAI также выпустила Grok-2 mini, более легкую версию, разработанную для более быстрого времени отклика при сохранении точности, подходящую для пользователей, которые ценят эффективность.

Противоречия и этические проблемы, связанные с генерацией изображений

Хотя Grok-2 сам по себе является языковой моделью, xAI одновременно развернула возможности генерации изображений на платформе X. Эта функция вызвала значительные споры, поскольку ее контентные фильтры кажутся значительно менее строгими, чем у конкурентов, таких как DALL-E, Gemini или Midjourney. Пользователи быстро обнаружили, что она может генерировать изображения политических деятелей, защищенных авторским правом персонажей и другой потенциально чувствительный или вводящий в заблуждение контент с меньшим количеством ограничений. Это вызывает опасения по поводу потенциального распространения дезинформации, особенно в политически чувствительное время, и злоупотребления ИИ для создания дипфейков или контента, нарушающего авторские права.

Производительность и конкуренция

Grok-2 показал высокие результаты в нескольких бенчмарках, заметно превзойдя GPT-4 в тестах на сложное рассуждение, таких как MMLU-Pro (измерение междисциплинарных знаний) и GPQA (оценка способности отвечать на вопросы на уровне выпускников). Однако в других областях, таких как математика и бенчмарки кодирования, модели, такие как серия GPT-4 от OpenAI и Claude 3.5 Sonnet от Anthropic, по-прежнему сохраняют конкурентное преимущество.

Доступность и планы на будущее

Первоначально доступ к Grok-2 и Grok-2 mini на X был в основном для подписчиков X Premium и Premium+, хотя позже стали доступны более широкие варианты доступа. xAI также сделала модели доступными через корпоративный API для разработчиков. Основываясь на отзывах пользователей, xAI продолжает совершенствовать модели.

Заглядывая в будущее, xAI планирует выпустить Grok-3, который, как сообщается, был обучен на массивном кластере, потенциально состоящем из более чем 100 000 графических процессоров Nvidia H100. Это сигнализирует об интенсивной конкуренции с грядущими моделями следующего поколения, такими как GPT-5. Хотя Grok-2 является многообещающим шагом, ландшафт ИИ остается крайне конкурентным, и для того, чтобы сравниться или превзойти конкурентов по всем возможностям, необходимы постоянные разработки.

Gábor Bíró 17 августа 2024 г.