Анализируя тонкие изменения частот, алгоритмы смогли определить разницу между здоровым голосом и «простуженным».
Скоро симулировать болезнь станет очень затруднительной задачей, так как учёные разработали технологию, которая лишь по звуку голоса определяет, настоящие у человека симптомы или нет.
Группа учёных из Национального технологического института имени Сардара Валлабхаи в Сурате, Индия, использовала машинное обучение, чтобы найти закономерности в звучании «простуженного» голоса и голоса здорового человека. Работа экспертов поможет научить нейросети различать болезненное состояние человека по его голосу.
Исследование основано на том, что человеческая речь, как музыкальный инструмент, не воспроизводит звуки одной частоты. Доминирующие ноты в человеческом голосе сопровождаются рядом более высоких обертонов. Амплитуда (громкость) нот в речи обычно уменьшается по мере продвижения по шкале частот. Эксперты предположили, что простуда может изменить процесс затухания волн.
Учёные использовали записи голосов 630 человек в Германии, 111 из них болели простудой. Каждый испытуемый должен был посчитать от 1 до 40 и рассказать, как он провёл выходные. Люди также читали вслух басню Эзопа «Северный ветер и солнце», которая с 1949 года является популярным текстом для фонетических исследований.
Исследователи разложили речь каждого человека на спектр составляющих её длин волн и определили доминирующие частоту и гармоники в каждом случае. Затем специалисты с помощью алгоритмов машинного обучения (Machine Learning, ML) проанализировали взаимосвязи между амплитудами гармоник и обнаружили закономерности, позволяющие отличить «простуженный» голос от здорового. Однако, результаты эксперимента показали, что таким способом правильно диагностировать простуду можно в 70% случаев.
Отмечается, что по речи можно диагностировать не только простуду. Другие учёные изучают, как различные болезни, от болезни Паркинсона и депрессии до рака шеи, могут влиять на частотные характеристики голоса человека. Такие исследования являются частью более широкой программы медиков, психиатров и программистов по дистанционному обнаружению биомаркеров заболеваний в данных, основанных на том, как люди говорят, пишут и даже ходят.
Спойлер: мы раскрываем их любимые трюки