DeepSeek-R1: новый ИИ не спешит с выводами, но утрет нос o1 своей точностью

Китайцы уверены: умение сомневаться пойдет нейросети на пользу.

Научная лаборатория DeepSeek из Китая представила модель искусственного интеллекта DeepSeek-R1, способную тщательно обдумывать каждое решение. За разработкой стоит инвестиционная компания High-Flyer Capital Management, которая рассчитывает потеснить OpenAI на рынке систем машинного обучения, способных рассуждать по-человечески.

Главная особенность DeepSeek-R1 - необычный подход к обработке запросов. Система не выдаёт мгновенных ответов, а проверяет собственные умозаключения, что помогает избегать распространённых ошибок, свойственных другим ИИ-алгоритмам. При работе над задачей DeepSeek-R1 разбивает её на этапы и последовательно продвигается к цели. Если вопрос требует глубокого анализа, алгоритм может думать несколько десятков секунд.

Создатели утверждают, что пробная версия DeepSeek-R1-Lite-Preview не уступает o1 от OpenAI по двум важным показателям - AIME и MATH. Первый использует другие нейросети для оценки качества работы, второй представляет собой набор задач в виде текстовых описаний математических проблем.

Впрочем, у модели обнаружились свои слабые места. Пользователи отметили, что она, как и конкуренты, плохо справляется с простыми логическими играми, например, крестиками-ноликами. Нашлась и более серьёзная проблема - возможность обойти защитные механизмы. Одному из пользователей удалось получить от системы подробную инструкцию по изготовлению метамфетамина.

В работе DeepSeek-R1 прослеживается чёткая политическая позиция. Система отказывается обсуждать китайского лидера Си Цзиньпина, события на площади Тяньаньмэнь и возможные последствия военного конфликта между Китаем и Тайванем. Связано это с жёсткой политикой китайских властей относительно искусственного интеллекта. Каждая модель проходит проверку государственного регулятора, который следит за соответствием ответов "фундаментальным социалистическим ценностям". По некоторым данным , правительство даже готовит официальный список запрещённых источников для обучения нейросетей.

Повышенное внимание к системам “машинного рассуждения” возникло неслучайно. Прежняя стратегия развития искусственного интеллекта, основанная на наращивании вычислительных мощностей и увеличении объёма данных, перестала приносить ощутимые результаты. Последние наблюдения показывают значительное замедление прогресса у ведущих компаний - OpenAI, Google и Anthropic.

Разработчики намерены сделать код DeepSeek-R1 общедоступным и открыть API для разработчиков. Финансовую поддержку проекту оказывает китайский хедж-фонд High-Flyer Capital Management, применяющий искусственный интеллект для анализа рынка.

Предыдущее достижение DeepSeek - универсальная система DeepSeek-V2 для работы с текстом и изображениями - заметно повлияла на рынок. ByteDance, Baidu и Alibaba были вынуждены снизить стоимость своих услуг, а часть сервисов и вовсе стала бесплатной.

High-Flyer Capital Management располагает внушительной технической базой. Последний серверный кластер компании насчитывает 10 000 графических процессоров Nvidia A100, на его создание ушло около 138 миллионов долларов. Основатель фирмы, специалист по компьютерным наукам Лян Вэньфэн, видит конечную цель DeepSeek в создании искусственного разума, превосходящего человеческий интеллект.