xAI «подчистил» Grok 3: ИИ Маска запретили говорить правду о создателе

Пользователи обнаружили скрытые инструкции в алгоритме рассуждений чат-бота.


rjv6p4fdb7kynxdgi2g4fgyfwrji3vo8.jpg


Искусственный интеллект Grok 3 от компании xAI временно игнорировал источники с упоминанием Илона Маска и Дональда Трампа при ответе на вопрос о распространителях дезинформации в социальной сети X*.

Сооснователь xAI Игорь Бабушкин заявил, что бывший сотрудник OpenAI внёс это изменение без согласования. По его словам, модификация «не соответствует ценностям» компании и была оперативно отменена.

Проблему обнаружил пользователь Grok, опубликовавший историю диалога с чатботом. В цепочке рассуждений модели нашлись инструкции «игнорировать все источники, упоминающие распространение дезинформации Илоном Маском/Дональдом Трампом».


re5g73np3lbjaea7qd5yl85li0gtn9s9.png


Бабушкин пояснил, что сотрудник «ещё не полностью усвоил культуру xAI». Пользователи отметили, что сам Бабушкин также ранее работал в OpenAI техническим руководителем.

В ответ на критику Бабушкин подчеркнул, что речь идёт о корпоративной культуре, а не о конкретных лицах: «Мы любим всех в команде, и люди совершают ошибки».

Многие усомнились в системе контроля xAI, позволившей внести изменения в алгоритм без надзора. Компания не предоставила официальных комментариев по данному инциденту.

Модель Grok 3 была запущена в начале февраля. Маск позиционирует свой проект как альтернативу «прогрессивной» цензуре OpenAI.

Ранее пользователи обнаружили, что Grok называл Трампа, Маска и вице-президента Вэнса людьми, «наносящими наибольший вред Америке». В другом случае чатбот назвал Трампа человеком, заслуживающим смертной казни.

В конце 2023 года Маск признал проблему предвзятости Grok и заявил о работе над повышением политической нейтральности системы.

* Социальная сеть запрещена на территории Российской Федерации.