CAPTCHA пала: как ИИ научился обходить проверки на человечность

Модель YOLO - конец эпохи «я не робот»?

Группе ученых из Швейцарской высшей технической школы Цюриха (ETH Zurich) во главе с Андреасом Плеснером удалось создать ИИ-модель, которая с невероятной точностью решает CAPTCHA -головоломки – те самые тесты, которые веб-сайты используют, чтобы отличить людей от ботов.

Модель, получившая звучное название YOLO (You Only Look Once) , была специально обучена для решения задач reCAPTCHAv2 – системы проверки, разработанной компанией Google. Эта версия предлагает пользователям найти определенные объекты, например светофоры или пешеходные переходы, среди набора изображений.

Ключом к успеху YOLO стал ограниченный набор объектов, связанных с дорожной тематикой. "Категории довольно узкие, поэтому задача сводится к выбору всех изображений со светофором или пешеходным переходом", – поясняет Плеснер. В общей сложности reCAPTCHAv2 оперирует примерно 13 различными типами объектов, включая автомобили, автобусы, велосипеды и дорожные переходы.

Для обучения модели исследователи использовали около 14 000 пар картинок с соответствующими метками, чтобы научить ее распознавать дорожную инфраструктуру. Этот подход и позволил достичь такой удивительной точности.

Команда Плеснера провела всестороннее тестирование YOLO в различных условиях. Ученые учли множество факторов, которые Google использует для выявления ботов. Среди них – способность ИИ имитировать движения мыши, характерные для человека, а также наличие на тестовом устройстве истории браузера и файлов cookie. Кроме того, ученые анализировали, как система реагирует на ответы, даваемые ИИ во время прохождения CAPTCHA-проверки.

Результаты оказались поразительными: ИИ успешно выполнял задания в 100% случаев. Однако это не означает, что все изображения были распознаны верно. Подобно человеку, YOLO мог отвергать некоторые варианты и запрашивать альтернативы. "Я был крайне удивлен, что [CAPTCHA] оказалась настолько уязвимой", – признался Плеснер.

Реакция Google не заставила себя ждать. Представитель Google Cloud заявил: "Наш приоритет – помочь клиентам защитить пользователей без применения визуальных тестов. Именно поэтому в 2018 году мы представили reCAPTCHA v3. Сейчас на 7 миллионах сайтов по всему миру большая часть защитных механизмов reCAPTCHA работает незаметно для пользователей. Мы осознаем, что уязвимости в технологиях распознавания изображений – не новая проблема. Поэтому мы непрерывно улучшаем reCAPTCHA, стремясь предотвратить злоупотребления и одновременно обеспечить комфортную работу для добросовестных пользователей".

Это исследование открывает новую главу в нескончаемом соревновании между разработчиками систем безопасности и создателями все более совершенных ИИ-моделей. Оно ставит перед индустрией кибербезопасности серьезный вопрос: как в будущем мы будем отличать людей от машин в цифровом пространстве?