Новости
- good_cat
- Администратор
Новости
В рамках проекта Common Voice Mozilla выпустила открытый датасет из записей человеческой речи на 18 языках, в том числе на немецком, французском, китайском и испанском. Общая длительность записей превышает 1300 часов. Компания планирует использовать набор данных в своих движках и предоставляет его всем желающим.
https://voice.mozilla.org/en/datasets
https://voice.mozilla.org/en/datasets
- good_cat
- Администратор
- Lecron
- Специалист
Новости
Интересно, когда программа сама сможет готовить себе датасет? Указываем папку аудиокниги, указываем ее текстовый файл, жмем кнопку "Создать голос", а программа сама, по анализу пауз и темпа навязываемого знаками препинания, привязывает одно к другому и формирует датасет. И вот мы, промозглым весенним вечером, сидя у камина с бокалом пунша в руке, слушаем книгу, озвученную голосом известного исторического персонажа или любимого артиста.
Да, я знаю, что новость про наборы для тренировки распознавания, но мечтать-то не вредно.
Отправлено спустя 16 часов 40 минут 13 секунд:
Понравились комменты на opennet.
Что не так с речью в Мозилле
Ну и по синтезу (mozilla/TTS)
Да, я знаю, что новость про наборы для тренировки распознавания, но мечтать-то не вредно.
Отправлено спустя 16 часов 40 минут 13 секунд:
Понравились комменты на opennet.
Что не так с речью в Мозилле
► Показать
► Показать
- Lecron
- Специалист
Новости
Развитие TTS технологий вне проприетарных сервисов, таки продолжается.
Open Source синтез речи SOVA / Хабр.
В комментариях утверждается, что качество даже получше Google TTS. Шанс на появление современных десктопных движков еще немного вырос.
Open Source синтез речи SOVA / Хабр.
В комментариях утверждается, что качество даже получше Google TTS. Шанс на появление современных десктопных движков еще немного вырос.