Ученые создали новую систему для защиты от прослушки через микрофоны в устройствах

Ученые создали новую систему для защиты от прослушки через микрофоны в устройствах

Система предугадывает, что пользователь скажет в следующий момент, и генерирует звуковой фоновый шум.

Специалисты Колумбийского университета разработали инновационный алгоритм, способный блокировать прослушку разговоров пользователей через микрофоны в смартфонах, голосовых помощниках и других IoT-устройствах.

Алгоритм работает предиктивно. То есть, он способен предугадывать, что пользователь скажет в следующий момент, и генерирует звуковой фоновый шум (шепот), мешающий расслышать разговор.

В настоящее время система работает только с английским языком, а ее эффективность достигает 80%. Громкость шума сравнительно низкая, чтобы не мешать пользователю спокойно разговаривать.

Как показали тестирования, система может делать разговор невозможным для распознавания автоматическими технологиями обработки естественной речи, независимо от используемого ПО и местоположения микрофона.

На сегодняшний день встроенными микрофонами оснащены практически все электронные устройства, которые «слушают» разговоры пользователей, чтобы потом подбирать им релевантную рекламу.

Многие исследователи пытались снизить риск подобной прослушки с помощью белого шума. Однако существующие в настоящее время методы маскировки звука в режиме реального времени использовать на практике невозможно, поскольку для аудио требуется почти мгновенное вычисление, а современное оборудование этого не позволяет.

Единственный способ решить проблему – создать предиктивную модель, которая следила бы за речью, выявляла ее характеристики и генерировала шумовые помехи на базе того, что будет сказано дальше.

На основе моделей прогнозирования глубоких нейронных сетей, применяемых для сокрытия потери пакетов, исследователи Колумбийского университета разработали новый алгоритм, который они назвали моделью «прогнозирующих атак». То есть, чтобы учитывать каждое произнесенное слово, модели распознавания речи обучены расшифровывать, предсказывать, когда пользователь произнесет эти слова, и в нужный момент генерировать шум.

Модель обучалась в течение двух дней с помощью восьми графических процессоров NVIDIA RTX 2080Ti на 100-часовом наборе данных.

В будущем специалисты намерены добавить в систему больше языков и сделать шум практически неразличимым для человеческого уха.

SOC как супергерой: не спит, не ест, следит за безопасностью!

И мы тоже не спим, чтобы держать вас в курсе всех угроз

Подключитесь к экспертному сообществу!