Yandex TTS
-
- Обыватель
Yandex TTS
Небольшая книжка на 350кб:
БА - 0.41м.
ПП - 0.46м.
Книжка на 1.7мб:
БА - 2.07м.
ПП - 2.55м.
По мне разница не существенная, тем более для обычного использования программы (не конвейерная запись).
Но! Важное и странное наблюдение. БА пропускает некоторые правила, но не дублирующиеся, а единичные. Ниже несколько примеров. Ударения там проставлены в варианте с ПП, с БА эти ударения не проставляются, хотя других похожих правил нет вовсе.
► Показать
- tonio_k
- V.I.P.
Yandex TTS
у вас пример не удачный. нужен пример несрабатывания со всей выкладкой
К тексту
вместе с Яковцом ушел из д+Ома
Правило
из дома=из дОма
Правило Ну никак не сработает потому что в тексте присутствует + и от алгоритма ПП или БА это не зависит.
-
- Обыватель
Yandex TTS
Я же написал, что это правило сработало только с ПП, фраза уже обработана, написал итоговый результат, чтобы было понятно какой именно кусок текста.
Тут обнаружилось еще то, что во всех этих случаях, есть разрыв строки в тексте, который перед этим убирается (не помню точно каким словарем).
Только что еще обнаружил такое. Если взять фрагмент текста который не срабатывает + пару абзацев снизу-сверху, то все ок, правило срабатывает. Если взять больше абзацев (пару страниц текста), то уже нет. И в самом тексте убираются некоторые переносы строк, текст сливается
Еще поковыряюсь, пока сам не понимаю этой фантастики.
Если интересно, могу отправить вам в личку текст, где срабатывает правило, и где уже нет (сугубо по алгоритму БА).
- GIS88
- Обыватель
Yandex TTS
speeck, спасибо за сборку! Можете пожалуйста, сделать сборку для премиальных голосов, хотя бы на основе исправленных словарей от chibis. У меня они работают нормально с повторной загрузкой битых файлов и размером фрагмента 3500.
-
- Обыватель
Yandex TTS
Вы можете сами скачать сборку под Филиппа от tonio_k, и заменить в ней словари с этой сборки.
Я могу сделать, но чуть позже, сейчас катастрофически трудно со временем.
Если получится сделать на днях, отпишусь вам.
- tonio_k
- V.I.P.
Yandex TTS
я в каком-то смысле занимаюсь популяризацией программы Демагог. Если сравнить Демагога с Балаболкой по встроенному функционалу и наваротам, то Демагог заметно проигрывает (если очень грубо - как Word против блокнота) что касается озвучки они принципиально одинаковы т.к. фактически озвучивают голосовые движки. Остаётся работа со словарями. А со словарями они работают одинаково как по скорости, так и по механизму их применения (тем не менее есть отличия. В Демагоге правила со звёздочками с большими возможностями, чем в Балаболке, а в Балаболке есть возможность через регулярные выражения менять регистр букв). Получается, что штатные и главные возможности у программ одинаковые (текст -> аудио)
- flegont
- V.I.P.
Yandex TTS
Быстрый Алгоритм (БА) дает заметный прирост в скорости применения для больших dic-словарей в тех случаях, когда доля правил со звездочками - мала, или таких правил вовсе нет.
Например, словарь ёфикации текста, примерно 300000 словоформ и ни одного правила со звездочкой. БА отрабатывает с этим словарем за считанные секунды, а Прямой Перебор - пыхтит несколько минут
В среднем, когда доля правил со звездочкой > 1/3 то разница в скорости между БА и ПП уже становится не существенной. В таких случаях рекомендуется использовать именно ПП. Он, к примеру, позволяет (при указании в Настройках) гарантированно применить правила в точности в том порядке, как они перечислены в словаре.
Например, словарь ёфикации текста, примерно 300000 словоформ и ни одного правила со звездочкой. БА отрабатывает с этим словарем за считанные секунды, а Прямой Перебор - пыхтит несколько минут
В среднем, когда доля правил со звездочкой > 1/3 то разница в скорости между БА и ПП уже становится не существенной. В таких случаях рекомендуется использовать именно ПП. Он, к примеру, позволяет (при указании в Настройках) гарантированно применить правила в точности в том порядке, как они перечислены в словаре.
- tonio_k
- V.I.P.
Yandex TTS
кроме того, на скорость ПП ощутимо влияет размер читаемого блока, выбираемого в настройках программы. Буквально вчера (в которой раз на те же грабли ) наткнулся и вспомнил про эту закономерность и добавил в скрипты увеличенный размер блока, что ускорило ПП. И в моих тестах разница в скорости между ПП и БА в словарях, запускаемых через скрипт с правилами состоящих в основном из 2-3 слов без звёздочек составила ровно 30% (БА быстрее). Будет время, ещё поэкспериментирую на определение максимального размера "блока для чтения" (начал с 44800 символов) для ПП. По идее, размер блока с целую книгу должен дать максимальное значение, но если поставить половину книги, то скорость не изменится, значит можно задать размер меньше. Почему бы не сделать размер блока "с запасом" на целую книгу и не заморачиваться? А дело в том, что тогда не получиться увидеть отображение "зеленной полосы прогресса" работы словаря. Красиво тоже должно быть!
UPD на скорость Быстрого Алгоритма размер "блока для чтения" не влияет. А вот для словарей с Регулярными выражениями - наоборот, чем меньше читаемый блок, тем они работают быстрее.
- flegont
- V.I.P.
Yandex TTS
Размер блока чтения для ПП можно выбрать ~ 1/3 от среднего размера книги. Тогда зеленая полоска будет работать по принципу: вжик (пауза) вжик (пауза) оп! - уноси готовенького
UPD Но мне представляется, что оптимум = ~ 40000 символов. И дальше затраты времени на работу ПП будут расти с ростом размера блока. Хотя и не так быстро, как в случае регулярных выражений
UPD Но мне представляется, что оптимум = ~ 40000 символов. И дальше затраты времени на работу ПП будут расти с ростом размера блока. Хотя и не так быстро, как в случае регулярных выражений
- tonio_k
- V.I.P.
Yandex TTS
пробовал 35.000 и 45.000 действительно 40.000 символов можно считать оптимальным, так как 45, 40, 35 у меня практически не отличаются друг от друга, а вот с дальнейшем увеличением или уменьшением начинается погрешность в сторону замедления в обе стороны.
- royx
- Прохожий
Yandex TTS
Решил выложить свою сборку для Yandex TTS на Python+Selenium+chromedriver. Основная плюшка это возможность использовать прокси (для Украины). Суть в том, что программа запускает браузер, вставляет текст и нажинает на кнопку - синтезировать. В данном случае не нужен ключ и работают VIP голоса. Саму книгу ложем в файл «!!!text!!!.txt», запускаем файл «!!!Start!!!.bat». Все настройки лежат в файле «SpeechKit.py».
- olelog
- Обыватель
Yandex TTS
Хотел попробовать вашу сборку, ничего не получается вообще. При открытии программы сразу выскакивает окно см. первый скрин, после нажатия OK запускается окно программы, которая не видит ни голосов Максима, и не читает вообще. Вы говорили на счет инструкции, однако ее тоже нет. Если что либо выкладываете, то поясняйте как "этим" пользоваться. Написали всего много, но все это непонятно для чего. Делайте поправку на обычных пользователей.
- Вложения
-
- Image 002.png (57.56 КБ) 3656 просмотров
-
- Image 001.png (84.82 КБ) 3656 просмотров
- olelog
- Обыватель
Yandex TTS
А вот нормально работающая программа от Tino_K
- Вложения
-
- Image 003.png (65.78 КБ) 3656 просмотров
- tonio_k
- V.I.P.
Yandex TTS
нажмите клавишу F12 (подождите пока не сменится список голосов с SAPI4 на SAPI5 и в том окошке, что у вас на скриншоте, появятся установленные у вас голоса относящиеся SAPI5 (в т.ч. Максим) и перезапустите Демагог. Ошибка больше не будет выскакивать.
Далее "примерно" как в инструкции:
http://i91650e3.beget.tech/viewtopic.php?t=434&start=200#p5170
- tonio_k
- V.I.P.
Yandex TTS
Что бы было "точно как по инструкции", то можете скачать сборку:
http://i91650e3.beget.tech/viewtopic.php?t=434&start=200#p4351
В ней удалить содержимое папок: dic и dic2
Затем из сборки http://i91650e3.beget.tech/viewtopic.php?t=59&start=750#p5486
Вытащить все файлы из папки dic и перенести их в папку dic первой сборки.
А дальше все как по видеоинструкции запускаете первую сборку.
http://i91650e3.beget.tech/viewtopic.php?t=434&start=200#p4351
В ней удалить содержимое папок: dic и dic2
Затем из сборки http://i91650e3.beget.tech/viewtopic.php?t=59&start=750#p5486
Вытащить все файлы из папки dic и перенести их в папку dic первой сборки.
А дальше все как по видеоинструкции запускаете первую сборку.
- olelog
- Обыватель
Yandex TTS
Спасибо, теперь все сработало ! Попробовал прослушать с данными словарями через Максима обработанный текст, ошибок просто море, с премиум голосами такого нет и близко. Может я что неправильно сделал ? При записи данной книги через "yndx_tts64" голосом Филлипа добавил в свои словари ну примерно 150 новых слов и выражений. Для 11 часов озвучки, 150 ошибок это не так много.
- Вложения
-
- Зверев - Разборки дезертиров.txt
- (1.01 МБ) 54 скачивания
-
- Image 004.png (143.52 КБ) 3640 просмотров
- tonio_k
- V.I.P.
Yandex TTS
конечно неправильно! Эти словари совсем не предназначены для Максима. Для Максима другая ветка форума
-
- Обыватель
Yandex TTS
Как забавно, когда я пришел на этот форум, то точно также рассуждал, прямо буквально
Будут вопросы - пишите, поясню, но tonio_kвам уже ответил.
Данная сборка сугубо под движок Яндекса старой версии (не Филипп), ну и вообще она максимально упрощена. Инструкции смотрите в сборке у tonio_k, т.к. это все суть одна система, у меня только лишь словари чуть изменены.
-
- Обыватель
Yandex TTS
Интересно будет посмотреть. Но тут уже есть сборка chibis под Премиум, причем, там уделено внимание ошибкам записи, и в случае ошибки записи определенного отрезка, скрипт пытается записать его повторно, и в целом делает это успешно (исходя из личных тестов). Есть ли у вас подобная обработка? Да, и, вопрос, разве Яндекс банит украинские/какие-либо еще ip?
- olelog
- Обыватель
Yandex TTS
Ну вы уж не сгущайте то краски, вопрос был не в премиум голосах, а в том, что при запуске, ваша сброка не видела движки вообще. Просто предполагал, что в вашей сборке уже есть "встроенные" старые движки от яндекса, а не одни упрощенные словари, поэтому интересно было попробовать. А то, что ваши словари не подходят к yndx_tts64 у меня вопрос не возникал вовсе. Проверил полезность вашей сборки для себя, и убедился что мне это вовсе не надо. А yndx_tts64 работает отлично, все пропущенные фрагменты великолепно дописывает. Для меня двух встроенных в сборку словарей вполне хватает, которые постоянно дорабатываю.speeck писал(а): ↑01 фев 2021 00:12Как забавно, когда я пришел на этот форум, то точно также рассуждал, прямо буквально
Будут вопросы - пишите, поясню, но tonio_kвам уже ответил.
Данная сборка сугубо под движок Яндекса старой версии (не Филипп), ну и вообще она максимально упрощена. Инструкции смотрите в сборке у tonio_k, т.к. это все суть одна система, у меня только лишь словари чуть изменены.
-
- Обыватель
Yandex TTS
Слушайте, ну вы даже не поняли что это за сборка, а упорно высказываете свое недовольство. Простите, что поделился с вами своей сборкой Над которой, к слову, работал несколько месяцев, ковыряясь в словарях, которые за многие годы набрали кучу всего лишнего и даже вредного.
Встроенные движки от Яндекса? Вы сами понимаете, что ищете? Вам нужен оффлайн движок от Яндекса? Эта сборка, как и оригинальная сборка от tonio_k, работает с Яндексом в онлайн режиме через скрипты. Для вызова скрипта нужно нажать CTRL+F2 и выбрать нужный. И тд.
Если вам упорно не нравится моя сборка, возьмите сборку от tonio_k (где "вшит" встроенный движок от Яндекса ) и просто замените там словари на словари из моей сборки. Хотя лучше не надо, опять мне придется вам что-то доказывать .....
Отлично
Причем тут это вообще? Вы сравниваете разные предметы, сами не понимаете еще этого? Если действительно не понимаете пишите в личку, либо можем созвониться в Тг, я объясню вам голосом, ибо нет времени расписывать одно и тоже по много раз. You are welcome.
Ну и отлично, можете по случаю поделиться своими словарями, кстати.
- good_cat
- Администратор
- olelog
- Обыватель
Yandex TTS
Никто вас не обвиняет вовсе, и никаких оффлайн движков я не ищу, зачем так утрировать ? Я просто написал, что это не то, что предполагал. Еще раз хочу сказать вам спасибо за ваш труд.speeck писал(а): ↑01 фев 2021 11:37Встроенные движки от Яндекса? Вы сами понимаете, что ищете? Вам нужен оффлайн движок от Яндекса? Эта сборка, как и оригинальная сборка от tonio_k, работает с Яндексом в онлайн режиме через скрипты. Для вызова скрипта нужно нажать CTRL+F2 и выбрать нужный. И тд.
Если вам упорно не нравится моя сборка, возьмите сборку от tonio_k (где "вшит" встроенный движок от Яндекса )
- good_cat
- Администратор
Yandex TTS
Уважаемый speeck, прослушал несколько книг с Вашей сборкой (признаюсь прямо, я не очень большой любитель online-TTS).
Хотелось бы предложить несколько улучшений.
Не все смогут изменять сами параметры конфигурации в файле конфигурации $UserForm.txt. Если работа над сборкой будет продолжена, было бы хорошо, если бы была возможность изменения параметров голоса через скрипт. Скорость чтения с интервалом 0.01, эмоциональность и так далее.
Проделана большая и очень качественная работа. Спасибо.
- olelog
- Обыватель
Yandex TTS
Для тех, кто использует yndx_tts64 выкладываю свой вариант словарей. Словари постоянно редактирую под Филиппа. Охотно выслушаю замечания.
- Вложения
-
- yndx_tts64всесловари.rar
- (478.81 КБ) 128 скачиваний
-
- Обыватель
Yandex TTS
Wow, спасибо
На самом деле "моя" сборка это скорее сборка tonio_k, я лишь довольно много поработал со словарями.good_cat писал(а): ↑01 фев 2021 13:49Не все смогут изменять сами параметры конфигурации в файле конфигурации $UserForm.txt. Если работа над сборкой будет продолжена, было бы хорошо, если бы была возможность изменения параметров голоса через скрипт. Скорость чтения с интервалом 0.01, эмоциональность и так далее.
Настройки голоса уже есть в ней. После выбора скрипта 10 или 20, нужно кликнуть на "Записать в аудио (mp3)" (двойной щелчок), если галочка уже стоит, они снимется, тогда снова кликнуть, и появится окошко с настройками. Там будет выбор голоса, скорость, настроение и тд.
Важно: Я внес еще одни правки в словари (спасибо tonio_k), актуальная версия доступна тут:
https://drive.google.com/drive/folders/ ... sp=sharing
Время от времени буду обновлять её там, чтобы здесь не плодить кучу версий.
К сожалению не могу отредактировать сообщение:
http://i91650e3.beget.tech/viewtopic.php?t=59&start=750#p5486
Там не корректная версия.
- speech
- Обыватель
Yandex TTS
good_cat, я отправил там тебе в ЛС ответ. Ознакомься, пожалуйста.
Здесь всё же форум, а не базар в армянском селе.
Здесь всё же форум, а не базар в армянском селе.
- Primkray
- Обыватель
Yandex TTS
Читаю про использование SSML в Yandex SpeechKit (https://cloud.yandex.ru/docs/speechkit/tts/ssml) и не вижу тэга для смены голоса в процессе синтеза речи. Не поддерживается в Yandex TTS?
- balabolka
- V.I.P.
Yandex TTS
Да, не поддерживается. Разработчики в "Яндексе" решили, что в этом нет необходимости: ведь можно текст для каждого голоса отправлять как отдельный запрос к серверу.
"Балаболка" не поддерживает SSML в запросах, но в программе реализован свой способ для смены голосов при чтении текста (кнопка Сменить язык справа от текста в окне "Онлайн-сервис для синтеза речи"):
Код: Выделить всё
Текст произносит один голос.{{Lang=ru-RU;kostya;1.0;n}}Текст произносит другой голос.{{Lang=}}Вновь первый голос.
- Primkray
- Обыватель
Yandex TTS
Код: Выделить всё
Текст произносит один голос.{{Lang=ru-RU;kostya;1.0;n}}Текст произносит другой голос.{{Lang=}}Вновь первый голос.
- balabolka
- V.I.P.
Yandex TTS
При использовании онлайн-сервисов результатом будет звуковой файл; чтения вслух там нет.
Имя голоса, скорость речи, эмоциональная окраска (n - нейтральная). Это всё параметры голоса в Yandex SpeechKit. Если скорость речи и эмоция для всех голосов одинаковые, два последних значения можно опустить.
- Primkray
- Обыватель
Yandex TTS
А имя голоса можно брать из выпадающего списка на странице Демо?
как только tts дошел до этого кода, запись остановилась с ошибкой "no audio data".
Это связано с неправильным выбором голоса?
В Балаболке вставил в текст Код: Выделить всё
{{Lang=ru-RU;ermil;0.9;e}}
Это связано с неправильным выбором голоса?
-
- Обыватель
- Primkray
- Обыватель
- Petrarca
- Прохожий
Yandex TTS
Привет, хотел спросить реально ли нужна обработка словарями для премиум голосов? Они вроде и так отлично читают. Хуже не сделают?
-
- Обыватель
- Lecron
- Специалист
Yandex TTS
Не понравилось. issue с ошибками там есть и от меня.
Вроде пример с демо довольно понятен. Если есть конкретные вопросы, можно обсудить в личке.
Кстати, написал такой словарик для своего пакета. Да, тоже иногда допускает ошибки, но в целом прекрасно совмещает падежи, рода, числа (единственное/множественное) и порядковость (один/первый). Лишнее подтверждение, что в правой части rex нужно уметь вызывать функцию. Не важно, питоновскую или луа. В коде можно многое сделать проще, понятнее и качественнее.
- speech
- Обыватель
Yandex TTS
А толку-то? ))
Если бы еще количество сопровождалось качеством, то и претензий бы не было.
А так по факту - куча голосов с траблами, и пять голосов с чуть меньшим количеством ошибок.
Ты посмотри теле-голоса ЦРТ. Они чистые. Я точно не уверен для длинных отрезков, но в демке именно так - они говорят лучше чем полные версии.
Если что, я не конкурент Яндекса, и достаточно взглянуть на Гугл! Там всего 5 голосов - как и у ЦРТ. И сделаны на голову стабильнее.
- Primkray
- Обыватель
Yandex TTS
Не спорю, у ЦРТ голоса очень качественные и приятные, но только один мужской голос, очень жаль...
- Primkray
- Обыватель
Yandex TTS
Что-то у Филиппа голос от смены эмоциональной окраски (е,g,n) вообще не меняется
А громкость этим способом можно регулировать?
- balabolka
- V.I.P.
Yandex TTS
Да, похоже, что разработчики решили отказаться от этого параметра: в документации он помечен как "deprecated" (устаревший).
Нет, такой параметр в Yandex SpeechKit отсутствует.
- Primkray
- Обыватель
Yandex TTS
Да, с эмоциями можно играть только на двух женских языках
А вот про изменение громкости и тембра вообще ничего не нашел.Эмоциональная окраска — поддерживается только при выборе русского языка (ru-RU) и голосов jane или omazh. Не используйте этот параметр с другими голосами и языками, так как при синтезе отдельных фраз голос может отличаться от ожидаемого.
Для этих голосов нейронная сеть обучалась на трех разных датасетах с репликами диктора, в которых фразы произносились с разной интонацией: радостной, раздраженной, нейтральной. Развивать поддержку эмоций для других голосов сейчас не планируется, а в премиум-голосах выбор подходящей интонации осуществляется автоматически
- ВладРыков
- Прохожий
- Primkray
- Обыватель
- andko
- Обыватель
Yandex TTS
Зачем он нужен, есть же многочисленные проигрыватели аудио, там можно изменить все что угодно.
- balabolka
- V.I.P.
Yandex TTS
Громкость звукового файла можно изменить с помощью утилит FFmpeg или SoX. Пример команды для уменьшения громкости в два раза (как описано здесь):
Код: Выделить всё
ffmpeg -i input.wav -filter:a "volume=0.5" output.wav
Код: Выделить всё
sox -v 0.5 input.wav output.wav
Код: Выделить всё
D:\FFmpeg\ffmpeg.exe -i %Input% -filter:a "volume=0.5" %Output%
- Primkray
- Обыватель
Yandex TTS
Да с изменением громкости звукового файла вопросов нет, понятно, что можно изменить отдельной программой. Я говорю о громкости отдельного слова или фразы при озвучке. К примеру в тексте есть фраза "он крикнул - привет". Вот слово "Привет" хотелось бы озвучить с увеличенной громкостью.
- РусланМаметьев
- Прохожий
Yandex TTS
Здравствуйте!
Хочу озвучить книжку YANDEXом. Если кто-то может это сделать легко за 100 руб., напишите мне пож. Раньше сам делал acapella Алена, но Яндекс мне показался намного лучше, замарачиваться с бубном уже не охота.
Хочу озвучить книжку YANDEXом. Если кто-то может это сделать легко за 100 руб., напишите мне пож. Раньше сам делал acapella Алена, но Яндекс мне показался намного лучше, замарачиваться с бубном уже не охота.
- Nixaristix
- Наблюдатель
Yandex TTS
Уже по разному экспериментирую с Филлипом, ставлю 1 поток и склеивать по 2 файла, много книжек уже прослушал так, все обрезаются постоянно, абзацы просто теряются, повторная озвучка ничего не меняет. Я так понял это у всех?
- andko
- Обыватель
Yandex TTS
Приведите примеры текста, где 1-2 абзаца теряются и не озвучиваются Филиппом, я попробую озвучить и проверить.