Google добилась прорыва в области синтеза речи с помощью ИИ :: Ивановский Торрент трекер
Важное объявление!
У Нас Все раздачи мультитрекерные, при нуле пиров в релизах, можете смело вставать на закачку!
 
Автор Сообщение

HUNTER

Стаж:
4 года 11 месяцев
Сообщений:
66066

Репутация: 101

[+] [-]
Вне форума [Профиль] [ЛС]


В настоящее время довольно просто понять, говорит ли реальный человек, или же речь идёт об искусственном преобразовании текста в речь. Но может пройти не так много времени, когда робот может заставить поверить в то, что разговор ведётся с настоящим человеком — всё благодаря новому искусственному интеллекту WaveNet, разработанному командой Google DeepMind.
DeepMind ранее уже не раз отличилась в создании успешных алгоритмов нейронных сетей — например, команда создала искусственный интеллект AlphaGo, который оказался весьма хорош при игре в го и обошёл одного из лучших игроков в эту настольную игру.
PASIEKA/Science Photo Library
В настоящее время разработчики используют два основных метода для создания программ генерации человеческой речи. Один подразумевает использование огромной коллекции слов и фрагментов речи, произнесённых одним человеком, из-за чего сложно манипулировать со звуками и интонациями голоса. Другой формирует слова электронно, в зависимости от того, как они должны звучать — интонации здесь задавать проще, но результат звучит гораздо менее естественно.
Чтобы создать синтезатор, звучащий близко к человеческой речи, команда в качестве входящих данных передала нейронной сети аудиозаписи реальных людей. WaveNet обучается соответствию текста определённым формам колебаний волны и затем на основании этой базы знаний формирует из текстовых отрывков отдельные звуковые волны.
Участвовавшие в тестировании люди оценивали новый метод в сравнении с другими алгоритмами на слух. Предпочтение было отдано WaveNet — этот ИИ звучал наиболее «по-человечески» из всех представленных. DeepMind заявляет, что их метод сокращает дистанцию между самыми лучшими синтезаторами и настоящей человеческой речью более чем вдвое. В эксперименте участвовали тексты на английском и китайском. Команда, впрочем, отмечает, что пока WaveNet не может применяться в приложениях, зато можно ознакомиться с образцами синтезированной речи на сайте DeepMind.

_________________
Показать сообщения:    

Текущее время: Сегодня 15:50

Часовой пояс: GMT



Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы