Google создал компьютерную программу, способную в точности имитировать человеческий голос. Она называется Tacotron 2 и служит для преобразования текста в речь.
Как сообщает Quartz, система состоит из двух нейросетей глубокого обучения. Первая преобразует текст в спектрограмму и передает алгоритму WaveNet, который озвучивает ее, генерируя соответствующие звуковые элементы.
Отмечается, что Tacotron 2 справляется с трудными для произношения словами и названиями, а также меняет интонации в зависимости от знаков препинания.
Примеры работы программы продемонстрированы на официальном сайте Google.
Пока Tacotron 2 может озвучивать тексты только на английском языке и только женским голосом. Ожидается, что программа будет внедрена в сервисы Google, например Google Assistant или фирменный онлайн-переводчик.
Ранее сообщалось, что группа ученых из американского университета штата Мэриленд обучила искусственный интеллект распознавать ложь в суде по выражению лица.