От $2 к $200 в час: зачем ИИ-гиганты разоряются на замену дешёвых аннотаторов
NewsMakerЭкспертная разметка — новый золотой стандарт в ИИ-индустрии.
Ведущие компании в области ИИ отказываются от практики массового привлечения низкооплачиваемых аннотаторов данных в развивающихся странах и переходят к сотрудничеству с высококвалифицированными специалистами из областей биологии, физики, программирования и финансов. Это необходимо для создания более сложных и «мыслящих» моделей — таких как OpenAI o3 и Google Gemini 2.5 — которым требуется не объём, а качество данных.
Если раньше в Кении или на Филиппинах тысячи людей вручную размечали изображения или отбирали текстовые варианты за $2 в час, теперь за эту работу берутся профессионалы. Компании вроде Scale AI, Turing AI и Toloka активно нанимают экспертов, способных разметить данные в специфических профессиональных контекстах и оценить корректность решений модели.
Генеральный директор Toloka Ольга Мегорская отмечает, что долгое время ИИ-индустрия игнорировала важность исходных данных, концентрируясь на архитектурах и вычислительных мощностях. Теперь же интерес инвесторов и разработчиков сместился в сторону качества обучающей выборки. По словам Мегорской, задачи, ранее выполнявшиеся вручную, уже частично автоматизированы, и теперь нужны те, кто может объяснить модели, как мыслить — пошагово, как человек.
Инвестиции подтверждают важность тренда: Meta вложила $15 млрд в Scale AI, удвоив её оценку до $29 млрд, Turing AI привлекла $111 млн, а Toloka получила $72 млн от Bezos Expeditions. Это наглядно иллюстрирует стратегический переход к более интеллектуальной разметке данных.
По данным главы Data Labelers Association в Кении Джоан Киньюа, даже оставшиеся низкоуровневые задачи теперь требуют локализованных языковых навыков. Кроме того, аннотаторы всё чаще выступают в роли контролёров качества: проверяют тексты, созданные самой моделью, и сообщают, где она ошибается.
Глава Turing AI Джонатан Сиддхарт объясняет: современные модели нуждаются не в сухих фактах, а в данных об использовании ИИ в реальной интеллектуальной работе — с детальной обратной связью от экспертов. К примеру, программисты могут разрабатывать задачи, решать их с нуля, отладкой и поиском уязвимостей. Физики — формулировать гипотезы и проверять их на симуляторах, созданных инженерами.
Такая многослойная коллаборация, по мнению Сиддхарта, выводит модель не просто на уровень отдельного специалиста, а на уровень гипотетического объединения лучших из лучших в каждой из трёх областей: физике, программировании и анализе данных. Ради этого компании готовы платить на 20–30% выше текущей зарплаты экспертов, даже если затраты на данные составляют всего 10–15% от общего бюджета на ИИ — а это всё равно «огромные деньги».
Создание таких возможностей, как пошаговое рассуждение, требует не просто технической аннотации, а работы, близкой к настоящему научному труду. И теперь именно это становится новой нормой в гонке ИИ за превосходство.

Ведущие компании в области ИИ отказываются от практики массового привлечения низкооплачиваемых аннотаторов данных в развивающихся странах и переходят к сотрудничеству с высококвалифицированными специалистами из областей биологии, физики, программирования и финансов. Это необходимо для создания более сложных и «мыслящих» моделей — таких как OpenAI o3 и Google Gemini 2.5 — которым требуется не объём, а качество данных.
Если раньше в Кении или на Филиппинах тысячи людей вручную размечали изображения или отбирали текстовые варианты за $2 в час, теперь за эту работу берутся профессионалы. Компании вроде Scale AI, Turing AI и Toloka активно нанимают экспертов, способных разметить данные в специфических профессиональных контекстах и оценить корректность решений модели.
Генеральный директор Toloka Ольга Мегорская отмечает, что долгое время ИИ-индустрия игнорировала важность исходных данных, концентрируясь на архитектурах и вычислительных мощностях. Теперь же интерес инвесторов и разработчиков сместился в сторону качества обучающей выборки. По словам Мегорской, задачи, ранее выполнявшиеся вручную, уже частично автоматизированы, и теперь нужны те, кто может объяснить модели, как мыслить — пошагово, как человек.
Инвестиции подтверждают важность тренда: Meta вложила $15 млрд в Scale AI, удвоив её оценку до $29 млрд, Turing AI привлекла $111 млн, а Toloka получила $72 млн от Bezos Expeditions. Это наглядно иллюстрирует стратегический переход к более интеллектуальной разметке данных.
По данным главы Data Labelers Association в Кении Джоан Киньюа, даже оставшиеся низкоуровневые задачи теперь требуют локализованных языковых навыков. Кроме того, аннотаторы всё чаще выступают в роли контролёров качества: проверяют тексты, созданные самой моделью, и сообщают, где она ошибается.
Глава Turing AI Джонатан Сиддхарт объясняет: современные модели нуждаются не в сухих фактах, а в данных об использовании ИИ в реальной интеллектуальной работе — с детальной обратной связью от экспертов. К примеру, программисты могут разрабатывать задачи, решать их с нуля, отладкой и поиском уязвимостей. Физики — формулировать гипотезы и проверять их на симуляторах, созданных инженерами.
Такая многослойная коллаборация, по мнению Сиддхарта, выводит модель не просто на уровень отдельного специалиста, а на уровень гипотетического объединения лучших из лучших в каждой из трёх областей: физике, программировании и анализе данных. Ради этого компании готовы платить на 20–30% выше текущей зарплаты экспертов, даже если затраты на данные составляют всего 10–15% от общего бюджета на ИИ — а это всё равно «огромные деньги».
Создание таких возможностей, как пошаговое рассуждение, требует не просто технической аннотации, а работы, близкой к настоящему научному труду. И теперь именно это становится новой нормой в гонке ИИ за превосходство.