xAI выпустил «самый умный в мире ИИ» — Grok 4

Стартап xAI Илона Маска представил Grok 4 — «самую мощную в мире ИИ-модель». Также запущен новый тарифный план SuperGrok Heavy за $300 в месяц.

https://twitter.com/i/web/status/1943230468519788551

«Grok 4 находится на таком уровне, что практически никогда не ошибается в вопросах по математике и физике на экзаменах — за исключением случаев, когда они намеренно составлены с подвохом. Он способен выявлять ошибки или неоднозначности в формулировках, а затем либо исправлять их, либо давать ответы на все возможные варианты интерпретации», — отметил миллиардер.

Во время прямой трансляции он сообщил, что новый чат-бот превосходит уровень доктора философии по всем предметам.

«Временами ему может не хватать здравого смысла, и он еще не изобрел новые технологии или не открыл новую физику, но это лишь вопрос времени», — добавил Маск.

Дополнительно представлена модель Grok 4 Heavy — мультимодальная версия Grok с повышенной производительностью. Согласно заявлению главы xAI, нейросеть запускает несколько агентов для одновременного решения задачи, после чего они сопоставляют свои ответы для поиска наилучшего результата.

Grok 4 показал высокие результаты в ряде бенчмарков, включая Humanity’s Last Exam — тест, оценивающий способность ИИ отвечать на тысячи пользовательских вопросов по математике, гуманитарным и естественным наукам. Чат-бот набрал 25,4% на этом экзамене, обойдя Gemini 2.5 Pro от Google (21,6%) и o3 от OpenAI (21%).

В ARC-AGI-2 Grok достиг нового передового результата — 16,2%. Тест включает в себя задачи-головоломки, в которых ИИ необходимо распознать визуальные шаблоны.

qjH4dgYkM9zE_7rkiISWIQw?key=wT7NoxaAzISmGy8rmPIFng.png

Помимо доступа к высокопроизводительной версии Grok подписчики SuperGrok Heavy смогут попробовать находящиеся в разработке продукты компании:

модель для программирования;
мультимодального агента;
ИИ-генератор видео.

Также новый тариф предложит:

расширенные возможности рассуждений,
инструменты для программирования;
приоритетную техническую поддержку;
увеличенные лимиты использования;
функции DeepSearch, Grok Studio, Big Brain.

xAI выпускает Grok 4 через API. Разработчики могут создавать приложения на его основе.

В ходе презентации продемонстрировали возможности Grok 4. Модель умеет распознавать видеоигры и оценивать их увлекательность, а также анализировать данные из X и формулировать прогнозы на Polymarket.

Релиз произошел на фоне скандала, в который попал Grok из-за спорных высказываний.

Напомним, в июле после очередного обновления чат-бот стал более категоричным и начал выдавать спорные и противоречивые заявления. Впоследствии команда xAI заявила, что работает над удалением неуместных публикаций.

Ранее Grok затронул тему «геноцида белых» в Южной Африке без соответствующего запроса со стороны пользователя, а также усомнился касательно количества погибших евреев во время Холокоста. Тогда его поведение объяснили «несанкционированной модификацией промпта».