Голосовые помощники могут быть опасны

Виртуальные помощники могут «жить» в смартфонах, планшетах и компьютерах (как Apple Siri) или в стационарных устройствах (таких как аудиоколонки Amazon Echo и Google Home). Круг их возможностей постоянно увеличивается: можно управлять воспроизведением музыки, узнавать погоду, регулировать температуру в доме, заказывать товары в интернет-магазинах…

Исследователи Рурского университета в Германии обнаружили, что голосовых помощников можно взломать с помощью неразличимых для человеческого слуха команд, спрятанных в аудиофайлах. Такая уязвимость заложена в самой технологии распознавания речи, которую использует искусственный интеллект.

По словам профессора Торстена Хольца, подобный метод взлома называется «психоакустическим скрытием». С его помощью хакеры могут прятать в разных аудиофайлах – с музыкой или даже пением птиц – слова и команды, которые может расслышать только машина. Человек будет слышать обычное чириканье, а вот голосовой помощник сможет различить кое-что еще.

golos-2

Хакеры могут проигрывать скрытое сообщение через приложение в рекламе. Таким образом они способны совершать покупки от лица других людей или красть конфиденциальную информацию. «В худшем случае злоумышленник может взять под контроль всю систему умного дома, включая камеры и сигнализацию», — пишут исследователи.

В этом видео представлена аудиозапись, в которой спрятана команда «Отключить камеру наблюдения и открыть входную дверь» — ее может различить только система распознавания голоса.

Злоумышленники могут использовать в своих целях «маскирующий эффект звука»: когда ваш мозг занят обработкой громких звуков определенной частоты, то на несколько миллисекунд вы перестаете воспринимать более тихие звуки на этой же частоте. Как обнаружили ученые, именно там можно прятать команды для взлома любой системы распознавания речи вроде Kaldi, которая лежит в основе голосового помощника Alexa от Amazon.

Похожий принцип позволяет сжимать MP3-файлы – алгоритм определяет, какие звуки вы сможете услышать и удаляет все неслышимое, чтобы уменьшить размер аудиофайла. Однако хакеры не удаляют неслышимые звуки, а заменяют их на нужные. В отличие от человека искусственный интеллект вроде Alexa способен слышать и обрабатывать каждый звук. Его обучили так, чтобы он мог понимать любую звуковую команду и выполнять ее, неважно, слышат ли ее люди или нет.

golos-3

Исследователи отмечают, что пока они испытали только неразличимые для человеческого уха команды и еще не пробовали взламывать устройства с помощью измененных песен или чириканья птиц. Однако, они уверены, что это сработает – в любом аудиофайле можно спрятать зашифрованное сообщение и вероятность успеха будет почти 100%.

В июне прошлого года было обнаружено, что можно успешно нашептывать Alexa команды на частоте, которую не воспринимает человеческое ухо. Чтобы защититься от подобной атаки нужно запретить Alexa совершать покупки, подключаться к банкам или открывать двери дома с помощью голосовых команд и сделать так, чтобы это было возможно только после ввода PIN-кода. Однако опция запроса PIN-кода по умолчанию отключена, так что не знающие о новом методе взлома пользователи находятся в зоне риска.

Представители Amazon сказали, что в компании серьезно относятся к вопросам безопасности и обязательно внесут исправления. Однако пока опасность все еще существует.

golos-1

Интеллектуальный ассистент Siri, который интегрирован во все устройства Apple, позволяет пользователям управлять многими приложениями посредством голосовых команд. В случае с приложением «Сбербанк Онлайн» владельцу гаджета даже не обязательно разблокировать смартфон, чтобы запросить код на совершение денежного перевода. Следовательно, любой, кто найдёт потерянный Айфон, сможет «опустошить» банковскую карточку, привязанную к нему. С карточками «Тинькофф» всё ещё проще: для совершения перевода с такой карты код верификации вовсе не требуется.

Сотрудники Сбербанка и Apple сейчас совместными усилиями трудятся над устранением проблемы. Пока же пользователям рекомендуется отключить показ содержания уведомлений на заблокированных экранах Айфонов и Айпадов.

Siri и другие голосовые помощники — Сortana (Microsoft), Alexa (Amazon), Bixby (Samsung), Алиса (Яндекс), Google Assistant — пока не блещут интеллектом. И это вполне объяснимо. «Умные» голосовые помощники базируются на архитектуре нейронных сетей и технологии машинного обучения. При этом надо понимать, что в мозгу человека около 86 млрд нейронов, а в современном искусственном интеллекте их всего несколько сот тысяч. Если посчитать количество нейронов в нервной системе различных животных, то выяснится, что, как отметил основатель и глава компании ABBYY Дэвид Ян, сейчас искусственный интеллект глупее пчелы.

 golos-4

«Этот рынок только зарождается и находится в стадии «early adopters», но совершенно точно, что интеллектуальные голосовые помощники и голосовые интерфейсы – это перспективная технология, которая со временем войдет в каждый дом. Скорость ее проникновения на рынок будет зависеть от цен на новую технику и полезности тех сервисов, которые поддерживают голосовые интерфейсы, но в ближайшие два года на массовое проникновение интеллектуальных голосовых помощников в потребительскую электронику рассчитывать не стоит», — считает ведущий аналитик Mobile Research Group Эльдар Муртазин.

Пока же полезность голосового помощника определяется в первую очередь не его интеллектом, а качеством распознавания речи и интегрированностью в различные информационные сети, интернет-сервисы, системы «умного» города и «умного» дома.

По материалам сайтов: kaspersky.ru, rb.ru, fastcompany.com, gazeta.ru, setphone.ru, bfm.ru