Одна из задач в области речевых технологий состоит в том, чтобы определить, какому человеку соответствует тот или иной речевой сигнал. Системы, решающие эту задачу, делятся на два больших класса – системы верификации и идентификации. Верификация – это процедура подтверждения личности говорящего, а идентификация – определение личности из заданного, ограниченного списка людей. В настоящее время системы идентификации и верификации голоса пользуются все большей популярностью во всем мире.
Голос человека обладает индивидуальными особенностями, уникален. Поэтому в последнее время компании-разработчики биометрических систем используют голос для определения личности говорящего. Все чаще встречаются системы, где голос выполняет функцию защиты. По голосу проверяют права доступа к компьютерным сетям, помещениям, банковским системам, камерам хранения, личной информации и др. Практика показала, что парольная защита является недостаточно надежной. Текстовые пароли и ключи уступают свое место верификации личности по голосу. Именно голос, является тем универсальным ключом, который нельзя подделать, сломать или украсть.
Верификация личности по голосу предполагает соответствие заранее установленного речевого образца вновь предъявляемому. Пользователь предварительно устанавливает какую-нибудь фразу в качестве пароля. Затем, пользователь произносит свой пароль. Система, проверяет, соответствует ли произнесенный голос заранее установленному эталону. Если соответствие подтверждается, то доступ к системе открывается. Таким образом, верификация по голосу обеспечивает большую степень надежности по сравнению с верификацией по паролю, вводимому с клавиатуры. Чужой голос подделать невозможно, в то время как подделка чужого пароля вполне доступна.
Идентификация личности по голосу представляет собой процесс установления, кому из ограниченного списка людей принадлежит голос. «Изучив» фонотеку, система укажет голос, наиболее близкий к исследуемому образцу.
Область применения систем, определяющих личность по голосу, можно разделить на два обширных блока:
- Первый блок составляют задачи контроля прав доступа к различным системам. Примером может служить «голосовой ключ» на входе в помещения с ограниченным доступом. В данном случае система «впускает» тех, чей голос содержится в базе данных. Еще один пример – быстрый доступа к личной банковской информации по телефону. Различные банковские операции возможны по телефону только при условии, если банковский компьютер узнает голос клиента.
- Второй блок связан с использованием систем анализа голоса говорящего при проведении криминалистических экспертиз и оперативно-розыскной деятельности. При различных чрезвычайных происшествиях, например, авиационных катастрофах, на основе записей переговоров можно восстановить обстановку и картину происшествия, определить кто произносит ту или иную фразу. Более того, по голосу возможно составить приблизительный внешний портрет телефонных шантажистов, террористов и других преступников. В современной юриспруденции голос может служить уликой в суде.