Одно слово — и вся переписка у Apple. Как работает Siri на самом деле

Вы не увидите, как Siri копирует вашу жизнь.


w73uvlp7732uwhhndyf2e96ow1ymifgy.jpg


Специалисты Lumia опубликовали техническое расследование под названием AppleStorm, в котором утверждается, что голосовой помощник Siri передаёт на серверы Apple больше пользовательских данных, чем необходимо для выполнения задач. В частности, в центре внимания оказались сообщения, продиктованные через Siri в мессенджерах WhatsApp и iMessage — как выяснилось, они пересылаются на сервера компании, даже если задача может быть обработана локально, без обращения к облачным системам.

Apple декларирует высокие стандарты приватности и использует гибридную модель ИИ, сочетающую локальные вычисления с облачным сервисом Private Cloud Compute (PCC). Однако выяснилось, что Siri обращается и к другим серверам, которые не входят в архитектуру PCC. Среди них — dictation-серверы (guzzoni.apple.com), поисковая инфраструктура (поддомен smoot.apple.com) и отдельные серверы расширений Apple Intelligence, через которые, например, осуществляется взаимодействие с ChatGPT.

Во время экспериментов исследователи использовали инструменты mitmproxy и Frida на macOS Sequoia с включённой Apple Intelligence. Простые запросы, вроде «Привет» или «Который час?», обрабатывались локально. Но при вопросе о погоде были зафиксированы два внешних соединения: одно — к серверу распознавания речи, второе — к поисковому сервису. Разбор переданных данных показал, что Siri автоматически собирает информацию о приложениях, установленных на устройстве, даже если они работают в виртуальной среде. Так, при вопросе о погоде были зафиксированы обращения и к встроенному приложению Apple Погода, и к Windows-приложению в среде Parallels.

Более того, в отправленных данных содержались точные координаты местоположения пользователя. Даже при формально включённой передаче геоданных, такие детали могли бы быть избыточны для запроса о погоде. Анализ пакетов также выявил передачу метаданных, связанных с другими приложениями — вплоть до названий файлов и процессов, открытых в момент обращения к Siri.

Особенно острые вопросы вызывает передача содержимого сообщений. При использовании Siri для отправки фразы через WhatsApp было обнаружено, что текст, номер получателя и другие атрибуты сообщения направляются на сервера Apple, причём не на инфраструктуру PCC. При этом функциональность не зависит от серверной части — даже при блокировке соединений, сообщение успешно отправляется. Это указывает на то, что отправка в облако происходит без технической необходимости.

В попытке уточнить, связано ли это с особенностями интеграции WhatsApp через SiriKit, исследователь создал собственное приложение по документации Apple — и столкнулся с идентичным поведением: отправленные через Siri сообщения из тестового приложения тоже уходили на серверы Apple. Похожая картина наблюдается и с iMessage.

Дополнительную путаницу вносит разветвлённость политик конфиденциальности. Siri и Apple Intelligence регулируются разными документами. В результате, две почти одинаковые команды — например, «Какая сегодня погода?» и «Спроси у ChatGPT, какая погода?» — обрабатываются разными системами с различным уровнем защиты и разными условиями сбора данных. Пользователь не имеет возможности узнать, какая именно подсистема будет использована.

Apple признала факт передачи данных, но не сочла это проблемой Apple Intelligence . Вместо этого ответственность была частично возложена на разработчиков сторонних сервисов, использующих SiriKit. Тем не менее, сама структура Siri явно отправляет больше данных, чем требуется, и делает это без уведомления пользователя. Прозрачность — один из главных лозунгов Apple в отношении ИИ, но на практике реализуется она избирательно.

На организационном уровне это может не только нарушать внутренние политики компаний, но и создавать угрозу утечки конфиденциальной информации. Эксперты рекомендуют администраторам устройств Apple блокировать трафик к доменам Siri, отключать функцию обучения приложений и внедрять политику контроля ИИ-функциональности. Однако всё это требует высокой технической осведомлённости, которой не обладают ни пользователи, ни большинство администраторов.

Сейчас, когда искусственный интеллект встраивается в любые повседневные задачи — от текста до планирования — становится почти невозможно определить, какие действия выполняются локально, а какие — уходят в облако. Тем более, если одно и то же приложение, одна и та же команда, могут попадать под разные протоколы работы с данными.