Yandex TTS. Словари. Обсуждение

Аватара пользователя
lplee

Yandex TTS

#51

Сообщение lplee »

lplee писал(а):
16 июл 2019 16:53
Кажется нашел в чем дело, в этих фрагментах текста есть символ "&". Во фрагментах которые обработались нормально его нет.
Да, именно в символе "&" было дело. А точнее, в словарях нашел правило:
&=.энд.
То есть, обрабатывались отдельно стоящие "&", а те, что внутри текста нет. Например такие:
"оля&вася".
Добавил в словарь:
*&*=.энд.
Теперь ок.

Аватара пользователя
lplee

Yandex TTS

#52

Сообщение lplee »

Вот как только разберусь со всем этим, напишу нормальную инструкцию, а то сейчас бардак, только без обид.
Инструкция будет не больше 2х листов формата А4, и там все будет понятно.

Отредактировано. good_cat.

Аватара пользователя
good_cat
Администратор

Yandex TTS

#53

Сообщение good_cat »

Рекомендую прекратить начало холиварных войн: что, где и как лучше. :butcher:
Не внявшие будут награждены переводом в режим только для чтения.

Аватара пользователя
good_cat
Администратор

Yandex TTS

#54

Сообщение good_cat »

lplee, Жду от вас инструкций. Месяца будет достаточно? Через месяц вернемся к этому вопросу.

Аватара пользователя
lplee

Yandex TTS

#55

Сообщение lplee »

good_cat писал(а):
16 июл 2019 18:18
lplee, Жду от вас инструкций. Месяца будет достаточно? Через месяц вернемся к этому вопросу
Мм, не могу обещать, т.к. через пару недель еду в отпуск, а вопросы которые я бы хотел затронуть только увеличиваются, вот например по работе со словарями, ни в одной из справок я пока не видел про это. Но инструкция будет, теперь уже не отвертеться ;)

Аватара пользователя
good_cat
Администратор

Yandex TTS

#56

Сообщение good_cat »

Обсуждение по теме "Омографы" просьба публиковать в теме "Омографы".
Сообщения перенесены в соответствующий раздел форума.

Аватара пользователя
alex
Постоялец

Yandex TTS

#57

Сообщение alex »

Здравствуйте, не подскажете как и в какой словарь внести изменения.
Яндекс выдаёт ошибку когда в тексте встречается символ, вернее буква
& это английская и ,например Camden Bank & Trust.
Исключение при вызове "DownloadFile" с "2" аргументами: "Удаленный сервер возвратил ошибку: (400) Недопустимый запрос."
СВЕД.: 0123 не получен
и ещё например если я хочу слово (потом) заменить во всём тексте на слово (затем)
в какой словарь это воткнуть.

Аватара пользователя
lplee

Yandex TTS

#58

Сообщение lplee »

alex писал(а):
18 июл 2019 14:52
Яндекс выдаёт ошибку когда в тексте встречается символ, вернее буква
&
В какой проге работаете? Какие словари есть?
Я в Демагоге, сборка то ли от Wasyka то ли от Тони, изменил в словаре "1.0_corector предв.dic":
Было: &=.энд.
Стало: *&*=.энд.
То есть, добавил звездочек, теперь норм.
Вообще вы можете свой словарь замен завести, прописав его в списке словарей. И не забывайте про порядок словарей! Чтобы правила обрабатывались последовательно и не мешали друг другу, но по этому поводу к Wasyka или Тони, они больше знают, тем более по своим сборкам

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS

#59

Сообщение tonio_k »

alex писал(а):
18 июл 2019 14:52
если я хочу слово (потом) заменить во всём тексте на слово (затем)
не самое удачное решение. Пример:
При виде зверя он покрылся потом.
После замены:
При виде зверя он покрылся затем.

Аватара пользователя
alex
Постоялец

Yandex TTS

#60

Сообщение alex »

tonio_k писал(а):
18 июл 2019 15:22
не самое удачное решение. Пример:
При виде зверя он покрылся потом.
да но иногда помогает если в тексте нет таких слов
А как можно - свой словарь замен завести, прописав его в списке словарей в демагоге.

Аватара пользователя
alex
Постоялец

Yandex TTS

#61

Сообщение alex »

tonio_k писал(а):
18 июл 2019 15:22
если я хочу слово (потом) заменить во всём тексте на слово (затем)
где можно посмотреть порядок словарей и какие применяются в демагоге?

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS

#62

Сообщение tonio_k »

Демагог+Yandex TTS - сборка от 2019-07-18 для подготовки книг и озвучивания Яндекс голосом на базе программы Демагог.
Обновлены словари для Яндекс. Словари любезно предоставленные ув. wasyaka

Рекомендации по добавлению своих правил в словари:
1) Правила в формате регулярных выражений добавляем в словарь:
- 30_Яндекс+REX_Замены пополнение.rex
2) Обычные правила с вставкой ударения за счёт изменения регИстра букв и прочие замены добавляем в словарь:
- 58_Яндекс+пост обработка.dic
3) Обычные правила с вставкой ударения за счёт вставки знака + для Яндекса добавляем в словарь:
- 72_Яндекс+слова.dic

Свои правила лучше держите в словаре в одной куче, не разбрасывайте их по словарям. Это для удобства их последующего перемещения в словари из сборки в сборку.

Не перезаписывайте сборку поверх старой - что бы не получить кашу. Сохраняйте отдельно.

Аватара пользователя
alex
Постоялец

Yandex TTS

#63

Сообщение alex »

tonio_k писал(а):
18 июл 2019 16:13
Рекомендации по добавлению своих правил в словари:
1) Правила в формате регулярных выражений добавляем в словарь:
- 30_Яндекс+REX_Замены пополнение.rex
да здесь не разберёшься, я к примеру хочу вместо слова потом вставить затем, или изменить имя слава на саша, мне в какой словарь вставлять в этот 30_Яндекс+REX_Замены пополнение.rex или свой маленький сделать под конкретный текст книги.в 30_Яндекс+REX_Замены пополнение.rex--я точно не разберусь.

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS

#64

Сообщение tonio_k »

Простые замены:
Слава=Саша
Добавляйте в 58_Яндекс+пост обработка.dic
Лучше новые словари не создавать, пока не научились в скрипты вносить изменения под себя. Добавляйте правила в существующие словари.

Как устроены словари По какому принципу работает смотрите на форуме ветки Demagog а также на официальном сайте Demagog -там много и подробно расписано.

Аватара пользователя
lplee

Yandex TTS

#65

Сообщение lplee »

tonio_k писал(а):
18 июл 2019 15:53
2) Обычные правила с вставкой ударения за счёт изменения регИстра букв и прочие замены добавляем в словарь:
- 58_Яндекс+пост обработка.dic
3) Обычные правила с вставкой ударения за счёт вставки знака + для Яндекса добавляем в словарь:
- 72_Яндекс+слова.dic
Замечу один момент. Официально Яндекс ставит ударение через знак +: "с+аша", но и через регистр ударение меняется, но по другому. Наверное правильно сказать меняется тон, но во многих словах это звучит как поменяли ударение. Попробуйте сравнить например "сАша", "сашА", "саш+а".

Аватара пользователя
lplee

Yandex TTS

#66

Сообщение lplee »

tonio_k писал(а):
19 июл 2019 10:21
1) Правила в формате регулярных выражений добавляем в словарь:
- 30_Яндекс+REX_Замены пополнение.rex

2) Обычные правила с вставкой ударения за счёт изменения регИстра букв и прочие замены добавляем в словарь:
- 58_Яндекс+пост обработка.dic

3) Обычные правила с вставкой ударения за счёт вставки знака + для Яндекса добавляем в словарь:
- 72_Яндекс+слова.dic
tonio_k писал(а):
19 июл 2019 10:21
Свои правила лучше держите в словаре в одной куче, не разбрасывайте их по словарям
Тк снова сумятица, я уточню.
Есть словари:
1. Регулярки
2. Ё
3. Ударения
4. Другие замены, например аббревиатуры.

Вы упоминули, что словари в сборках не желательно менять, чтобы в случае обновлений быстро перенести свои исправления. Давайте подумаем, куда девать свои замены?

Тк основные замены уже есть в словарях, очевидно своих будет не много, поэтому моя идея, завести 2 своих словаря: для регулярок rex, и обычный dic.

В обычном можно сделать разделение на все типы замен (кроме регулярок):
2. Ё.
3. Ударения.
4. Другие замены, например аббревиатуры.

Только нужно понять порядок следования замен, а также порядок подключения своих словарей, наверное после всех основных?

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS

#67

Сообщение tonio_k »

lplee писал(а):
19 июл 2019 10:21
Яндекс ставит ударение через знак +: "с+аша", но и через регистр ударение меняется, но по другому.
вот это по другому - ставит как то не предсказуемо. "Плюс" - это 90% что ударение будет правильным не проверяя повторным прослушиванием, при этом, для надёжности, все буквы желательно перевести в нижний регистр.

Что касается словарей... Дело в том, что сборку делаю в каком то смысле "в слепую". Я не являюсь пользователем Яндекс голоса мне на слух ближе и понятнее Максим ivona (!не спорим о фломастерах!). У меня на руках наработки словарей waska + собственные наработки под голос Максим. Словари от waska оставил почти без изменений "как есть" так как он реальный слушатель Яндекса.

Все заморочки со словарями сборки, это попытки склеить его и мои наработки в единую неразрывную цепочку. Что бы при применении словарей к окну в стандартном режиме Демагога (при активации галочками словарей на панели словарей и нажать кнопку показать измененный текст) в результате получим точно такой же результат как при применении скрипта. Это необходимо при анализе как сработали правила.
Проблема одна - Демагог применяет словари сначала регулярки и лишь потом обычные словари. При этом, регулярки и обычные словари (при отключении соответствующей галочки) применяются внутри каждой группы между собой строго друг за другом по наименованию словаря. Собственно из за этой особенности и начались работы в сторону скриптов. Часто нужно именно чередование регулярки и обычных словарей. Было бы очень удобно если бы можно было устанавливать последовательность меняя названия словаря, но что имеем, с тем работаем. Потому и часть словарей в другой папке (dic2) и отдельный скрипт первичной обработки, который запускает словари из папки dic2 - без запуска которого, анализ правил будет не полным.
lplee писал(а):
19 июл 2019 10:37
понять порядок следования замен, а также порядок подключения своих словарей, наверное после всех основных?
На счёт пользовательских словарей,
Я добавлю в сборку несколько пустых словарей с пометкой например "Мой словарь" и пропишу их в скриптах что бы они подхватывались. Останется их заполнять своими правилами. Одну регулярку и обычный словарь добавлю в скрытую папку. Одну регулярку после всех регулярок, один простой словарь до ударений, другой сразу после ударений.
Если буду что то менять в словарях по их названию - будет понятно какой нужно заменить своим.

Уточню, сборки меняю только если появляются изменения в алгоритмах скриптов. Когда создавал сборку, я думал, что один раз выложив, оставлю как есть.
Но, гляжу, эксперименты продолжаются. Наверное для таких случаев лучше действительно создать пустые словари для пользователей.

Аватара пользователя
lplee

Yandex TTS

#68

Сообщение lplee »

tonio_k писал(а):
19 июл 2019 12:19
У меня на руках наработки словарей waska + собственные наработки под голос Максим
А где можно найти вашу последнюю сборку с Максимом?
tonio_k писал(а):
19 июл 2019 12:19
Потому и часть словарей в другой папке (dic2) и отдельный скрипт первичной обработки, который запускает словари из папки dic2 - без запуска которого, анализ правил будет не полным.
Можно поподробнее тут? Я запускаю только один скрипт, не помню дословно, но ctrl+f2, "обработать словарями", как-то так, затем запись в мп3, все по вашей инструкции.
Сейчас вы говорите про ещё одну обработку через dic2, чем это делать?

Аватара пользователя
lplee

Yandex TTS

#69

Сообщение lplee »

tonio_k писал(а):
19 июл 2019 12:40
Одну регулярку и обычный словарь добавлю в скрытую папку. Одну регулярку после всех регулярок, один простой словарь до ударений, другой сразу после ударений.
Тут бы ещё мини-справку сделать, что к чему, почему именно такая последовательность, и зачем дублирование словарей до и после ударений и тд

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS

#70

Сообщение tonio_k »

lplee писал(а):
19 июл 2019 12:40
А где можно найти вашу последнюю сборку с Максимом?
http://i91650e3.beget.tech/viewtopic.php?f=42&t=49#p55
lplee писал(а):
19 июл 2019 12:40
Сейчас вы говорите про ещё одну обработку через dic2, чем это делать?
http://i91650e3.beget.tech/viewtopic.php?t=59&start=250#p2519
lplee писал(а):
19 июл 2019 12:43
Тут бы ещё мини-справку сделать, что к чему, почему именно такая последовательность, и зачем дублирование словарей до и после ударений и т.д.
я могу попробовать, но она будет такой поверхностной. Станет понятна только тогда, когда вы внесете правило не в тот словарь и ваше правило не сработает или сломает что то. Когда вы разберетесь как и почему такое произошло, изучите словари, разберетесь что такое rex словарь, от чего зависит скорость его работы, что такое быстрый алгоритм и алгоритм перебора для dic словарей, плюсы и минусы каждого, разность в скорости обработки текста посмотрите какой метод для какого словаря применяется, сами создадите кучу правил, только тогда будет понятна почему была выбрана такая последовательность. и почему луче скриптом пользоваться, а не стандартным Демагоговским способом. С этими словарями я эксперементировал год если не больше. И до сих пор эксперементирую. И то что есть сейчас -это самое лучшее что я смог оптимизировать за год. Многое упирается не в сами в словари, а в содержащихся в них правилах. Просто поверьте на слово что так более менее оптимально сделано. И объяснить что и почему так надо я физически не смогу.
Скажу в одним предложением: словари имеют именно такую последовательность и алгоритм через скрипт к каждому словарю выбран именно такой,- что бы получить баланс между скоростью и последовательностью срабатывания правил.

P.S. словари за основу были взяты от waska и тот алгоритм который он применяет меня со временем не устроил. Поэтому я в свое время отделился и пошел своим путём.

Отредактировано. good_cat.

Аватара пользователя
good_cat
Администратор

Yandex TTS

#71

Сообщение good_cat »

 ! Сообщение из: good_cat
lplee, на бан напрашиваетесь? Читайте внимательно правила форума. Следующего предупреждения не будет, уйдете в творческий отпуск для составления инструкций. Сообщение удалено.

Аватара пользователя
alex
Постоялец

Yandex TTS. Словари. Обсуждение

#72

Сообщение alex »

tonio_k писал(а):
18 июл 2019 17:04
Простые замены:
Слава=Саша
Добавляйте в 58_Яндекс+пост обработка.dic
Скажите, почему вы в словаре меняете слова типа "кто-то" "что-то"на "кто-тэ" "что-тэ" насколько я убедился из всех;
"кто то"
"кто тэ"
"кто-то" именно "кто-то"звучит наиболее естественно.И что-то тоже. На других словах не проверял.
И ещё вопрос зачем в таких словах удаляют тире "-"
что-то.что-то.что-то.что-то.
что тэ. что тэ. что тэ..что тэ.
что то. что то. что то. что то.
кто-то. кто-то. кто-то. кто-то.
кто-тэ. кто-тэ. кто-тэ. кто-тэ.
tts.wav
(1.36 МБ) 427 скачиваний

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS. Словари. Обсуждение

#73

Сообщение tonio_k »

Это рудименты которые улучшают звучание Максима
http://i91650e3.beget.tech/viewtopic.php?f=5&t= ... 1%8A#p1727
В Яндексе прослушивал эти слова с изменением "то" на "тэ" или на "та" звучит, на мой слух, благозвучнее.

Удаляются "тире между словами" в 90_REX_доп обработка.rex Под раздачу попадают и что-то и кто-то
Поэтому в папке dic2 файл 20_Ё-фикатор.dic и в шапке посмотреть - там есть слова, где резервируются исключения что бы не попасть под эту замену.
Можно там поправить или добавить те связки которые вам нужно зарезервировать

Но есть одно но. Если вы "что то" Замените например на "чт+ото", то
в последующих словарях например подробное правило:

что то в глаза попало=что то в глазА попало

Уже никогда не сработает
Потому что в тексте слова что то после замены самом начале уже не существует.

Поэтому если вас что-то не устраивает в звучание или в замене сделайте эту замену в словаре: 58_Яндекс+пост обработка.dic добавьте обратно изменяющее поравило в стиле:
что тэ=что-то
Теперь никаких проблем не должно быть

Аватара пользователя
alex
Постоялец

Yandex TTS. Словари. Обсуждение

#74

Сообщение alex »

кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то
Я понял и вот так изменил.А в этом словаре в 58-м свои добавления лучше по алфавиту
рассовывать или можно вниз словаря всё прописать?

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS. Словари. Обсуждение

#75

Сообщение tonio_k »

alex писал(а):
22 июл 2019 16:45
кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то
добавлю в следующую сборку
alex писал(а):
22 июл 2019 16:45
рассовывать или можно вниз словаря всё прописать?
свои правила лучше в самый низ.
А перед своими правилами в виде шапки вставить комментарий через # Например:

Код: Выделить всё

#это мои словари. Сохранить при переносе в другую сборку!
кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то
В следующей сборке добавлю пустые словари и пропишу их в скрипте что бы они подхватывались. В эти словари будете добавлять свои правила что бы вносить свои изменения.

Аватара пользователя
alex
Постоялец

Yandex TTS. Словари. Обсуждение

#76

Сообщение alex »

tonio_k писал(а):
22 июл 2019 17:01
В следующей сборке добавлю пустые словари и пропишу их в скрипте что бы они подхватывались. В эти словари будете добавлять свои правила что бы вносить свои изменения.
Да это было бы круто,а то каждый раз думаешь как бы что не сломать.

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS. Словари. Обсуждение

#77

Сообщение tonio_k »

В принципе вы уже сейчас можете сделать это. Все очень просто. Для этого:
1) Откройте папку dic,
2) Создайте копию файла 58_пост обработка.dic
3) Переименуйте созданную копию файла, например, в 60_МОЙ СЛОВАРЬ.dic - и удалите его содержимое.
4) Перенесите свои правила в этот новый словарь, сохраните
5) Откройте СПИСОК СЛОВАРЕЙ.lua
6) найдите строку:

Код: Выделить всё

WFilter(0,0,dic..'58_пост обработка.dic',false) -- перебором (галочка убрана)
7)сделайте прямо под ней её копию
8)Переименуйте в 60_МОЙ СЛОВАРЬ.dic что бы получилось уже 2 строки:

Код: Выделить всё

WFilter(0,0,dic..'58_пост обработка.dic',false) -- перебором (галочка убрана)
WFilter(0,0,dic..'60_МОЙ СЛОВАРЬ.dic',false) -- перебором (галочка убрана)
Ваш пользовательский словарь готов и будет теперь автоматом подхватываться скриптом при обработке словарями.

Аватара пользователя
alex
Постоялец

Yandex TTS. Словари. Обсуждение

#78

Сообщение alex »

вроде получилось работает !
► Показать

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS. Словари. Обсуждение

#79

Сообщение tonio_k »

alex писал(а):
22 июл 2019 18:32
вроде получилось работает !
то что у вас выводит через показать измененный текст - это одно, а то что выводит через скрипт это другое. Вы можете сколько угодно добавлять словари в папке dic, Но если это не прописано в самом скрипте, то эти словари будут игнорироваться. Попробуйте запустить именно скрипт к окну и посмотреть какой будет результат в окне статистики

Аватара пользователя
alex
Постоялец

Yandex TTS. Словари. Обсуждение

#80

Сообщение alex »

tonio_k писал(а):
22 июл 2019 18:38
Попробуйте запустить именно скрипт к окну и посмотреть какой будет результат в окне статистики
было
► Показать
стало
► Показать
файл словаря
► Показать

Аватара пользователя
AndOSjZ
Постоялец

Yandex TTS. Словари. Обсуждение

#81

Сообщение AndOSjZ »

Сейчас на скорую руку сделал небольшой эксперимент(т.е. взял маленький текст)обработал в Балаболка словарями для RHVoice с сайта ГолосКниги озвучил Yandex(Захар,Оксана)результат,вы знаете,впечатлил,надо только добавить обработку ц ,у RHVoice нет такой проблемы
P.S. Забыл,в изменённом тексте произвести замену Q на + ,заменить все

Аватара пользователя
good_cat
Администратор

Yandex TTS. Словари. Обсуждение

#82

Сообщение good_cat »

Просьба иллюстрации убирать под спойлер.

Аватара пользователя
alex
Постоялец

Yandex TTS. Словари. Обсуждение

#83

Сообщение alex »

tonio_k писал(а):
22 июл 2019 18:38
вроде получилось работает !
Тогда всЪё будет хорошо для него и тебя.
После обработки словарями получается такая ошибка яндекс её не читает.
Причём распаковал новую программу из архива.Подскажите как её убрать у меня в моём словаре не получилось пробовал так: "всъё=всё"

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS. Словари. Обсуждение

#84

Сообщение tonio_k »

ошибка в словаре 20_Яндекс+REX_Замены от waska.rex
найдите 2 строчки начинающиеся со значка решётки # в разделе
###все,всем

Код: Выделить всё

#(\bвс)(е\b)([^.,:;!?-]{0,25})(ался|ание|ееся|ется|еться|ится|ось|уюся|шем|шься|яние|своё)\b=$1ё$3$4

Код: Выделить всё

#\b(в)сё (\w+но|\w+лись)=$1се $2
и удалите их.

Аватара пользователя
alex
Постоялец

Yandex TTS. Словари. Обсуждение

#85

Сообщение alex »

tonio_k писал(а):
23 июл 2019 17:02
ошибка в словаре 20_Яндекс+REX_Замены от waska.rex
ошибка устранилась сама собой ничего не менял, видимо во временных файлах было что то.
выяснил следующее яндех неправильно ставит ударение в слове
"скажи"
он произносит "ск+ажи" на первом слоге, это после обработки словарями без словарей ставит правильно.Но словари это слово не меняют. :thank:
Также "пожалуйста" яндех произносит правильно, а после обработки нет.
словарь меняет это слова на "пожалуста" но и его янд читает правильно, загадка!
вилимо влияет окружающие слова.

Аватара пользователя
AndOSjZ
Постоялец

Yandex TTS. Словари. Обсуждение

#86

Сообщение AndOSjZ »

tonio_k
На компе обработал книгу в вашей последней сборке(скрипт 10...)потом на смарт в Acrow и ...я очень доволен,вы молодец

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS. Словари. Обсуждение

#87

Сообщение tonio_k »

Демагог+Yandex TTS - Критическая ошибка в словарях. Откройте словарь 50_ОМОГРАФЫ 1 Омо.dic найдите в нем строку стороны озера=со сторонЫ Озера и змените на: со стороны озера=со сторонЫ Озера. Иначе при срабатывании этого правила будет зависание. В след обнове поправлю

Аватара пользователя
Sylvia
Постоялец

Yandex TTS. Словари. Обсуждение

#88

Сообщение Sylvia »

Скачала Demagog-Yandex_2019-07-18.zip. Простите, можно задать пару глупых вопросов? Честно читала форум, ответов для себя не нашла
1. Не могу понять - нужно ли ставить галочки в окне словарей? пробовала с ними и без, даже если галки не стоят, то все равно текст обрабатывается словарями. Долгие годы пользовалась Балаболкой, в ней, если галки не стояли, то словари не принимались во внимание.

2. Мне нужно записать книгу в мр3. Если выбрать скрипт 11_ОКНО ЗАПИСАТЬ В MP3 (YandexTTS).lua , то не надо предварительно выбирать скрипты 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua и 10_ОКНО ОБРАБОТАТЬ СЛОВАРЯМИ.lua ? Если я правильно поняла, то эта предварительная обработка все равно проходит?
То есть, для качественной записи аудиокниги нужно выбрать голос, открыть текстовый файл в окне и выбрать скрипт 11? Или скрипт 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua тоже запускать?
Заранее спасибо и извините за бестолковость.

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS. Словари. Обсуждение

#89

Сообщение tonio_k »

Sylvia писал(а):
03 авг 2019 15:25
1. Не могу понять - нужно ли ставить галочки в окне словарей?
если книга обработается через скрипты, то в самом скрипте прописаны словари в нужной последовательности. Так что при работе скриптов, галочки в панели словарей ни на что не влияют.
Sylvia писал(а):
03 авг 2019 15:25
Долгие годы пользовалась Балаболкой, в ней, если галки не стояли, то словари не принимались во внимание.
в Демагоге в штатном режиме (т.е. не через скрипты)- всё точно так же. Если вы хотите обработать текст в штатом режиме (активируя словари галочками), то только в этом и только в этом случае надо запустить скрипт 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua больше он нигде не нужен. Этот скрипт запускает словари, находящиеся в папке dic2. Они спрятаны отдельно от папки dic что бы не смешившись с основными словарями. А согласно логике схемы срабатывания словарей эти словари должны сработать самыми первыми. Поэтому они отнесены в категорию первичная обработка.
Sylvia писал(а):
03 авг 2019 15:25
То есть, для качественной записи аудиокниги нужно выбрать голос, открыть текстовый файл в окне и выбрать скрипт 11?
да всё правильно. И голос можно выбрать и сохранить только один раз. Скрипт с настройками Яндекс голос не обязательно запускать каждый раз - только если надо его поменять.

Аватара пользователя
Sylvia
Постоялец

Yandex TTS. Словари. Обсуждение

#90

Сообщение Sylvia »

tonio_k, Все понятно, спасибо Вам за сборку и разъяснение :thank:
Обнаружился единственный непонятный момент (но это не по словарям) - почему-то у некоторых голосов меняется интонация и высота, голос внезапно становится женским. Хотя выбрана нейтральная эмоция. Мягко говоря, напрягает... Для сравнения записала один и тот же отрывок разными голосами, так этот глюк присутствует не у всех.

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS. Словари. Обсуждение

#91

Сообщение tonio_k »

Демагог+Yandex TTS - сборка от 2019-08-26 для подготовки книг и озвучивания Яндекс голосом на базе программы Демагог.
Словари любезно предоставленные ув. wasyaka
Получение mp3 от Яндекса через скрипт от balaamster
Изменения:
► Показать

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS. Словари. Обсуждение

#92

Сообщение tonio_k »

skreb писал(а):
26 авг 2019 16:44
1. Из сборки исчезли скрипты "10_ОКНО ОБРАБОТАТЬ СЛОВАРЯМИ.lua"
Выбираете:
10_ОКНО ОБРАБОТАТЬ СЛОВАРЯМИ И ЗАПИСАТЬ В MP3 YaTTS,
далее выбираете пункт: " ДЛЯ ПРОСЛУШИВАНИЯ В ACROW", Получаете обработанный словарями файл. Вносите свои изменения и к текущему окну запускаете:
40_ПОВТОРНО (при сбое) ЗАПИСАТЬ В MP3 YaTTS
skreb писал(а):
26 авг 2019 16:44
2. Словарь "80_Паузы" стал обрабатывать текст по другому.
Ошибся. Исправил. Перезалил.

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS. Словари. Обсуждение

#93

Сообщение tonio_k »

По всей видимости я немного перемудрил с текстом диалогом выбора.
Сделал как было раньше по смыслу:
► Показать

Аватара пользователя
AndOSjZ
Постоялец

Yandex TTS. Словари. Обсуждение

#94

Сообщение AndOSjZ »

tonio_k
из словаря 58... удалил строку тоъ=тэ и не надо в доп. словарях городить типа кто тэ=кто то и тому подобное

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS. Словари. Обсуждение

#95

Сообщение tonio_k »

AndOSjZ писал(а):
26 авг 2019 19:04
из словаря 58... удалил строку тоъ=тэ
тоъ встречается неоднократно в словарях 50, 52, 53..
Вообще, "тоъ" появляется на этапе первичной обработки. И под эту самую "тоъ" и подгонялись словари 50,52,53. Удачное ли это решение или нет - вопрос дискутивный. Однако если вы удалите правило тоъ=тэ будет на слух озвучено чёткое тО вместо "та".
Можете попробовать заморочиться и заменить все правила с тоъ во всех словарях на то, но при этом нужно будет добавть дубль этого правила с одним отличием - добавить еще вариант и с тире перед "то". Надеюсь понятно сформулировал)))
в 58 Лучше исправить так: поднять правило тоъ=тэ выше:
тоъ=тэ
кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то

Аватара пользователя
AndOSjZ
Постоялец

Yandex TTS. Словари. Обсуждение

#96

Сообщение AndOSjZ »

кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то
дело не только в них,в текстах много других то ,я то,вам то,ну и т. п. и с тэ звучат не очень
Послушаю как оно в таком варианте

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS. Словари. Обсуждение

#97

Сообщение tonio_k »

Можно попробовать создать такого рода правила:
#
$*а тэ=а-то
$*б тэ=б-то
$*в тэ=в-то
...
И т.д. по алфавиту.

# и отдельно только для гласных на случай если подставились ударения:
$*А тэ=А-то
$*Е тэ=Е-то
$*О тэ=О-то
...
И т.д. *И *Ё *Ю ...

Т.е. возвращаем обратно тире на место как было.

Аватара пользователя
AndOSjZ
Постоялец

Yandex TTS. Словари. Обсуждение

#98

Сообщение AndOSjZ »

А в каком словаре эти тире удаляются?

Аватара пользователя
tonio_k
V.I.P.

Yandex TTS. Словари. Обсуждение

#99

Сообщение tonio_k »

AndOSjZ писал(а):
26 авг 2019 22:28
А в каком словаре эти тире удаляются?
dic2\00_REX_подготовка текста.rex

Код: Выделить всё

# Удаление тире внутри слова типа: "точь-в-точь" или "из-за"
(\w+)-то\b=$1-тоъ
(\w+)\-(\w+)\-(\w+)=$1 $2 $3
(\w+)\-(\w+)=$1 $2

Аватара пользователя
AndOSjZ
Постоялец

Yandex TTS. Словари. Обсуждение

#100

Сообщение AndOSjZ »

Прослушал yandex,ivona,vocalizer и все говорят нормально кто-то, что-то, наконец-то и т.п. если между буквами и тире нет пробелов
или пишутся слитно

Ответить

Вернуться в «Онлайн-сервисы для синтеза речи»