Примерное время чтения: 4 минуты
141

ФСБ имитирует голоса по телефону…

На днях ФСБ заказала интересную техническую разработку: систему имитации голоса.

Задачу "исследовать для русского языка возможность имитации голоса заданной личности с сохранением высокой разборчивости речи" силовики предлагают решить за 13 месяцев, пишет «Амител» со ссылкой на "Маркер ".



Наука о голосах


Войсковая часть № 35533 из подмосковного города Железнодорожного опубликовала на официальном сайте госзакупок сообщение о конкурсе.

В одном из его лотов речь идет об "антропоморфных методах анализа и обработки речи". Задача ставится такая: разработать "способ автоматической верификации личности по голосу, а также способы изменения и имитации голоса заданной личности". На эти цели заказчик готов потратить 6 млн руб. Срок выполнения работ — не больше 13 месяцев.

Войсковая часть № 35533 — одно из подразделений ФСБ.

В интернете легко найти подтверждения этому: например, решение о передаче профилактория и дошкольного учреждения с баланса в/ч 35533 ФСБ России в муниципальную собственность г. Железнодорожного.

Среди других проектов этого подразделения — автоматизированное составление текстового резюме звукозаписи (на это выделено 20 млн руб.); определение психоэмоционального состояния говорящего (7 млн руб.); нахождение в большом количестве записей тех, в которых звучит голос нужного человека (13 млн руб.).



Что уже сделано


Сегодня в мире уже работают системы идентификации личности говорящего. Так, в Мексике существует база данных голосов на 600 тыс. человек. Система (ее разработчик — петербургская компания "Центр речевых технологий" (ЦРТ)) может проводить 600 млн сравнений в сутки. С ее помощью местная полиция собирается, к примеру, определять личность похитителя по телефонному разговору с родственниками похищенного.

Прототипы систем имитации голоса уже существуют, рассказывает главный эксперт ЦРТ Сергей Коваль. Но пока специалисты легко отличают подделку.

Сегодня для создания имитации требуется не менее часа речи нужного человека. Речь разрезают на мельчайшие кусочки (так называемые аллофоны звуков) и из них собирают нужные слова. Затем на сигнал надо наложить индивидуальную интонацию. Пока что "швы" между звуками видны специалистам, объясняет Коваль. Но эта задача будет решена, считает он. Это вопрос времени.

P.S. Видимо, в скором времени, перед началом телефонного разговора, дабы проверить личность своего собеседника, нам придется использовать кодовые слова…

Хуже обстоит дело с записью на диктофон. Если вы слышите голос своего знакомого на диктофонной записи, разглашающего все стратегические данные не важно чего, проверить он ли это на самом деле практически не возможно…мы привыкли доверять своему слуху…

 

Смотрите также:

Оцените материал
Оставить комментарий (0)

Также вам может быть интересно

Топ 5 читаемых

Самое интересное в регионах