Устройство распознает все ваши мысли по движению гортани.
Ученые из Кембриджского университета разработали умное колье , которое способно распознавать речь по микродвижениям горла. Это изобретение может стать настоящим спасением для тех, кто потерял способность говорить из-за болезни или травмы.
Колье выглядит как чокер и представляет собой мягкую эластичную ткань с встроенными электронными датчиками. Его комфортно носить, что особенно важно для людей с ограниченными возможностями. Оно может помочь пациентам после операций на гортани, а также страдающим от болезни Паркинсона, последствий инсульта или церебрального паралича.
Главная особенность нового гаджета - использование методов машинного обучения. Благодаря этому устройство распознает различия в произношении, акценте и словарном запасе разных пользователей. Такой подход значительно сокращает время, необходимое для разработки и обучения.
Колье относится к типу технологий, известных как “интерфейсы безмолвного доступа”. Оно анализирует невокальные сигналы, чтобы декодировать речь в тишине. Пользователю достаточно лишь артикулировать слова, чтобы устройство их распознало. Затем захваченные речевые сигналы могут быть переданы на компьютер или динамик для облегчения общения.
Тесты показали впечатляющие результаты: колье способно распознавать слова с точностью более 95%. При этом оно использует на 90% меньше вычислительной энергии по сравнению с существующими передовыми технологиями. Доктор Луиджи Оккипинти из Кембриджского центра графена, руководивший исследованием, отметил, что существующие решения для людей с нарушениями речи часто не справляются с захватом слов и требуют длительного обучения. Кроме того, они жесткие, громоздкие и иногда даже требуют инвазивной операции на горле.
Устройство изготовлено из экологичного текстиля на основе бамбука с датчиками деформации на основе графеновых чернил, встроенными в ткань. Когда датчики обнаруживают любую деформацию, в графене образуются крошечные контролируемые трещины. Как раз благодаря этому чувствительность более чем в четыре раза выше, чем у аналогов.
Модель обучалась на базе данных наиболее часто используемых слов в английском языке. Они также отобрали слова, которые легко перепутать, например, "book" (книга) и "look" (смотреть). В выборку включили речь людей разного пола, носителей и не носителей английского языка, а также разные акценты и скорость речи.
Благодаря способности устройства захватывать богатые динамические характеристики сигнала, исследователям удалось использовать легкие архитектуры нейронных сетей с упрощенной глубиной и размерностью сигнала для извлечения и улучшения признаков речевой информации. В результате получилась модель машинного обучения с высокой вычислительной и энергетической эффективностью, идеально подходящая для интеграции в носимые устройства с батарейным питанием и возможностями обработки искусственного интеллекта в реальном времени.
Хотя умному колье еще предстоит пройти обширные испытания и клинические исследования, прежде чем оно будет одобрено для использования пациентами, исследователи утверждают, что их изобретение может также применяться в других приложениях для мониторинга здоровья или для улучшения связи в шумной среде.