Речь нейросети от Google не отличить от человеческой

Как утверждают создатели, в отличие от существующих программ, новый синтезатор речи способен в точности имитировать человеческий голос.

Во время ретрансляции Tacotron 2 распознаёт знаки препинания, подчеркивает слова с большой буквы и отлично справляется с особенностями произношения имён. Ее назначение - преобразовывать текст в речь. Качество генерируемой речи расценивали обычные юзеры. WaveNet, к примеру, издавала очень резкие звуки.

Метод Tacotron 2, работающий на основе двух нейронных сетей, представила команда разработчиков Google с участием Джонатана Шена. Печатная версия конвертируется в специальную Tacotron-спектрограмму, в которой распределяются ритм и ударения, а слова генерируются в аналоге WaveNet. Отличить, где синтезированная речь, а где речь человека, практически невозможно. Генерируемый им голос неотличим от человеческого даже для обладателя музыкального слуха, и в этом заслуга сразу 2-х нейронных систем, входящих в состав ИИ. Правда, часть слушателей в комментариях заявляет, что некоторые слова система выговаривает «ломано».

В автобусе на Невском у туриста из Дании вытащили iPhone и кошелек
В Калининградской области ввели выплаты семьям при рождении первого ребенка

Поделиться в социальных сетях