Новости

Ответить
Аватара пользователя
good_cat
Администратор

Новости

#1

Сообщение good_cat »

В рамках проекта Common Voice Mozilla выпустила открытый датасет из записей человеческой речи на 18 языках, в том числе на немецком, французском, китайском и испанском. Общая длительность записей превышает 1300 часов. Компания планирует использовать набор данных в своих движках и предоставляет его всем желающим.

https://voice.mozilla.org/en/datasets

Аватара пользователя
tonio_k
V.I.P.

Новости

#2

Сообщение tonio_k »

Что восхитило, так это при выборе языка нет русского, зато есть чувашский! :hi:
► Показать
Вот даже не знаю что это значит и какова история такого решения :suspect:

Аватара пользователя
good_cat
Администратор

Новости

#3

Сообщение good_cat »

Русский язык тоже планируется... позже.
► Показать

Аватара пользователя
Lecron
Специалист

Новости

#4

Сообщение Lecron »

Интересно, когда программа сама сможет готовить себе датасет? Указываем папку аудиокниги, указываем ее текстовый файл, жмем кнопку "Создать голос", а программа сама, по анализу пауз и темпа навязываемого знаками препинания, привязывает одно к другому и формирует датасет. И вот мы, промозглым весенним вечером, сидя у камина с бокалом пунша в руке, слушаем книгу, озвученную голосом известного исторического персонажа или любимого артиста.
Да, я знаю, что новость про наборы для тренировки распознавания, но мечтать-то не вредно.


Отправлено спустя 16 часов 40 минут 13 секунд:
Понравились комменты на opennet.
Что не так с речью в Мозилле
► Показать
Ну и по синтезу (mozilla/TTS)
► Показать

Аватара пользователя
Lecron
Специалист

Новости

#5

Сообщение Lecron »

Развитие TTS технологий вне проприетарных сервисов, таки продолжается.
Open Source синтез речи SOVA / Хабр.
В комментариях утверждается, что качество даже получше Google TTS. Шанс на появление современных десктопных движков еще немного вырос.

Ответить

Вернуться в «Сведения, обсуждения»