Страница 2 из 5
Yandex TTS
Добавлено: 16 июл 2019 17:08
lplee
lplee писал(а): ↑16 июл 2019 16:53
Кажется нашел в чем дело, в этих фрагментах текста есть символ "&". Во фрагментах которые обработались нормально его нет.
Да, именно в символе "&" было дело. А точнее, в словарях нашел правило:
&=.энд.
То есть, обрабатывались отдельно стоящие "&", а те, что внутри текста нет. Например такие:
"оля&вася".
Добавил в словарь:
*&*=.энд.
Теперь ок.
Yandex TTS
Добавлено: 16 июл 2019 17:16
lplee
Вот как только разберусь со всем этим, напишу нормальную инструкцию, а то сейчас бардак, только без обид.
Инструкция будет не больше 2х листов формата А4, и там все будет понятно.
Отредактировано. good_cat.
Yandex TTS
Добавлено: 16 июл 2019 18:03
good_cat
Рекомендую прекратить начало холиварных войн: что, где и как лучше.
Не внявшие будут награждены переводом в режим только для чтения.
Yandex TTS
Добавлено: 16 июл 2019 18:18
good_cat
lplee, Жду от вас инструкций. Месяца будет достаточно? Через месяц вернемся к этому вопросу.
Yandex TTS
Добавлено: 16 июл 2019 18:24
lplee
good_cat писал(а): ↑16 июл 2019 18:18
lplee, Жду от вас инструкций. Месяца будет достаточно? Через месяц вернемся к этому вопросу
Мм, не могу обещать, т.к. через пару недель еду в отпуск, а вопросы которые я бы хотел затронуть только увеличиваются, вот например по работе со словарями, ни в одной из справок я пока не видел про это. Но инструкция будет, теперь уже не отвертеться ;)
Yandex TTS
Добавлено: 18 июл 2019 08:52
good_cat
Обсуждение по теме "Омографы" просьба публиковать в теме
"Омографы".
Сообщения перенесены в соответствующий раздел форума.
Yandex TTS
Добавлено: 18 июл 2019 14:52
alex
Здравствуйте, не подскажете как и в какой словарь внести изменения.
Яндекс выдаёт ошибку когда в тексте встречается символ, вернее буква
& это английская и ,например Camden Bank & Trust.
Исключение при вызове "DownloadFile" с "2" аргументами: "Удаленный сервер возвратил ошибку: (400) Недопустимый запрос."
СВЕД.: 0123 не получен
и ещё например если я хочу слово (потом) заменить во всём тексте на слово (затем)
в какой словарь это воткнуть.
Yandex TTS
Добавлено: 18 июл 2019 15:11
lplee
alex писал(а): ↑18 июл 2019 14:52
Яндекс выдаёт ошибку когда в тексте встречается символ, вернее буква
&
В какой проге работаете? Какие словари есть?
Я в Демагоге, сборка то ли от Wasyka то ли от Тони, изменил в словаре "1.0_corector предв.dic":
Было: &=.энд.
Стало: *&*=.энд.
То есть, добавил звездочек, теперь норм.
Вообще вы можете свой словарь замен завести, прописав его в списке словарей. И не забывайте про порядок словарей! Чтобы правила обрабатывались последовательно и не мешали друг другу, но по этому поводу к Wasyka или Тони, они больше знают, тем более по своим сборкам
Yandex TTS
Добавлено: 18 июл 2019 15:22
tonio_k
alex писал(а): ↑18 июл 2019 14:52
если я хочу слово (потом) заменить во всём тексте на слово (затем)
не самое удачное решение. Пример:
При виде зверя он покрылся
потом.
После замены:
При виде зверя он покрылся
затем.
Yandex TTS
Добавлено: 18 июл 2019 15:50
alex
tonio_k писал(а): ↑18 июл 2019 15:22
не самое удачное решение. Пример:
При виде зверя он покрылся потом.
да но иногда помогает если в тексте нет таких слов
А как можно - свой словарь замен завести, прописав его в списке словарей в демагоге.
Yandex TTS
Добавлено: 18 июл 2019 15:53
alex
tonio_k писал(а): ↑18 июл 2019 15:22
если я хочу слово (потом) заменить во всём тексте на слово (затем)
где можно посмотреть порядок словарей и какие применяются в демагоге?
Yandex TTS
Добавлено: 18 июл 2019 16:13
tonio_k
Демагог+Yandex TTS - сборка от
2019-07-18 для подготовки книг и озвучивания Яндекс голосом на базе программы Демагог.
Обновлены словари для Яндекс. Словари любезно предоставленные ув.
wasyaka
Рекомендации по добавлению своих правил в словари:
1) Правила в формате регулярных выражений добавляем в словарь:
-
30_Яндекс+REX_Замены пополнение.rex
2) Обычные правила с вставкой ударения за счёт изменения рег
Истра букв и прочие замены добавляем в словарь:
-
58_Яндекс+пост обработка.dic
3) Обычные правила с вставкой ударения за счёт вставки знака + для Яндекса добавляем в словарь:
-
72_Яндекс+слова.dic
Свои правила лучше держите в словаре в одной куче, не разбрасывайте их по словарям. Это для удобства их последующего перемещения в словари из сборки в сборку.
Не перезаписывайте сборку поверх старой - что бы не получить кашу. Сохраняйте отдельно.
Yandex TTS
Добавлено: 18 июл 2019 16:53
alex
tonio_k писал(а): ↑18 июл 2019 16:13
Рекомендации по добавлению своих правил в словари:
1) Правила в формате регулярных выражений добавляем в словарь:
- 30_Яндекс+REX_Замены пополнение.rex
да здесь не разберёшься, я к примеру хочу вместо слова потом вставить затем, или изменить имя слава на саша, мне в какой словарь вставлять в этот 30_Яндекс+REX_Замены пополнение.rex или свой маленький сделать под конкретный текст книги.в 30_Яндекс+REX_Замены пополнение.rex--я точно не разберусь.
Yandex TTS
Добавлено: 18 июл 2019 17:04
tonio_k
Простые замены:
Слава=Саша
Добавляйте в 58_Яндекс+пост обработка.dic
Лучше новые словари не создавать, пока не научились в скрипты вносить изменения под себя. Добавляйте правила в существующие словари.
Как устроены словари По какому принципу работает смотрите на форуме ветки Demagog а также на официальном сайте Demagog -там много и подробно расписано.
Yandex TTS
Добавлено: 19 июл 2019 10:21
lplee
tonio_k писал(а): ↑18 июл 2019 15:53
2) Обычные правила с вставкой ударения за счёт изменения регИстра букв и прочие замены добавляем в словарь:
- 58_Яндекс+пост обработка.dic
3) Обычные правила с вставкой ударения за счёт вставки знака + для Яндекса добавляем в словарь:
- 72_Яндекс+слова.dic
Замечу один момент. Официально Яндекс ставит ударение через знак +: "с+аша", но и через регистр ударение меняется, но по другому. Наверное правильно сказать меняется тон, но во многих словах это звучит как поменяли ударение. Попробуйте сравнить например "сАша", "сашА", "саш+а".
Yandex TTS
Добавлено: 19 июл 2019 10:37
lplee
tonio_k писал(а): ↑19 июл 2019 10:21
1) Правила в формате регулярных выражений
добавляем в словарь:
- 30_Яндекс+REX_Замены пополнение.rex
2) Обычные правила с вставкой ударения за счёт изменения регИстра букв и прочие замены
добавляем в словарь:
- 58_Яндекс+пост обработка.dic
3) Обычные правила с вставкой ударения за счёт вставки знака + для Яндекса
добавляем в словарь:
- 72_Яндекс+слова.dic
tonio_k писал(а): ↑19 июл 2019 10:21
Свои правила лучше держите в словаре в одной куче, не разбрасывайте их по словарям
Тк снова сумятица, я уточню.
Есть словари:
1. Регулярки
2. Ё
3. Ударения
4. Другие замены, например аббревиатуры.
Вы упоминули, что словари в сборках не желательно менять, чтобы в случае обновлений быстро перенести свои исправления. Давайте подумаем, куда девать свои замены?
Тк основные замены уже есть в словарях, очевидно своих будет не много, поэтому моя идея, завести 2 своих словаря: для регулярок rex, и обычный dic.
В обычном можно сделать разделение на все типы замен (кроме регулярок):
2. Ё.
3. Ударения.
4. Другие замены, например аббревиатуры.
Только нужно понять порядок следования замен, а также порядок подключения своих словарей, наверное после всех основных?
Yandex TTS
Добавлено: 19 июл 2019 12:19
tonio_k
lplee писал(а): ↑19 июл 2019 10:21
Яндекс ставит ударение через знак +: "с+аша", но и через регистр ударение меняется, но по другому.
вот это по другому - ставит как то не предсказуемо. "Плюс" - это 90% что ударение будет правильным не проверяя повторным прослушиванием, при этом, для надёжности, все буквы желательно перевести в нижний регистр.
Что касается словарей... Дело в том, что сборку делаю в каком то смысле "в слепую". Я не являюсь пользователем Яндекс голоса мне на слух ближе и понятнее Максим ivona (!не спорим о фломастерах!). У меня на руках наработки словарей waska + собственные наработки под голос Максим. Словари от waska оставил почти без изменений "как есть" так как он реальный слушатель Яндекса.
Все заморочки со словарями сборки, это попытки склеить его и мои наработки в единую неразрывную цепочку. Что бы при применении словарей к окну в стандартном режиме Демагога (при активации галочками словарей на панели словарей и нажать кнопку показать измененный текст) в результате получим точно такой же результат как при применении скрипта. Это необходимо при анализе как сработали правила.
Проблема одна - Демагог применяет словари сначала регулярки и лишь потом обычные словари. При этом, регулярки и обычные словари (при отключении соответствующей галочки) применяются внутри каждой группы между собой строго друг за другом по наименованию словаря. Собственно из за этой особенности и начались работы в сторону скриптов. Часто нужно именно чередование регулярки и обычных словарей. Было бы очень удобно если бы можно было устанавливать последовательность меняя названия словаря, но что имеем, с тем работаем. Потому и часть словарей в другой папке (dic2) и отдельный скрипт первичной обработки, который запускает словари из папки dic2 - без запуска которого, анализ правил будет не полным.
lplee писал(а): ↑19 июл 2019 10:37
понять порядок следования замен, а также порядок подключения своих словарей, наверное после всех основных?
На счёт пользовательских словарей,
Я добавлю в сборку несколько пустых словарей с пометкой например "Мой словарь" и пропишу их в скриптах что бы они подхватывались. Останется их заполнять своими правилами. Одну регулярку и обычный словарь добавлю в скрытую папку. Одну регулярку после всех регулярок, один простой словарь до ударений, другой сразу после ударений.
Если буду что то менять в словарях по их названию - будет понятно какой нужно заменить своим.
Уточню, сборки меняю только если появляются изменения в алгоритмах скриптов. Когда создавал сборку, я думал, что один раз выложив, оставлю как есть.
Но, гляжу, эксперименты продолжаются. Наверное для таких случаев лучше действительно создать пустые словари для пользователей.
Yandex TTS
Добавлено: 19 июл 2019 12:40
lplee
tonio_k писал(а): ↑19 июл 2019 12:19
У меня на руках наработки словарей waska + собственные наработки под голос Максим
А где можно найти вашу последнюю сборку с Максимом?
tonio_k писал(а): ↑19 июл 2019 12:19
Потому и часть словарей в другой папке (dic2) и отдельный скрипт первичной обработки, который запускает словари из папки dic2 - без запуска которого, анализ правил будет не полным.
Можно поподробнее тут? Я запускаю только один скрипт, не помню дословно, но ctrl+f2, "обработать словарями", как-то так, затем запись в мп3, все по вашей инструкции.
Сейчас вы говорите про ещё одну обработку через dic2, чем это делать?
Yandex TTS
Добавлено: 19 июл 2019 12:43
lplee
tonio_k писал(а): ↑19 июл 2019 12:40
Одну регулярку и обычный словарь добавлю в скрытую папку. Одну регулярку после всех регулярок, один простой словарь до ударений, другой сразу после ударений.
Тут бы ещё мини-справку сделать, что к чему, почему именно такая последовательность, и зачем дублирование словарей до и после ударений и тд
Yandex TTS
Добавлено: 19 июл 2019 13:37
tonio_k
lplee писал(а): ↑19 июл 2019 12:40
А где можно найти вашу последнюю сборку с Максимом?
http://i91650e3.beget.tech/viewtopic.php?f=42&t=49#p55
lplee писал(а): ↑19 июл 2019 12:40
Сейчас вы говорите про ещё одну обработку через dic2, чем это делать?
http://i91650e3.beget.tech/viewtopic.php?t=59&start=250#p2519
lplee писал(а): ↑19 июл 2019 12:43
Тут бы ещё мини-справку сделать, что к чему, почему именно такая последовательность, и зачем дублирование словарей до и после ударений и т.д.
я могу попробовать, но она будет такой поверхностной. Станет понятна только тогда, когда вы внесете правило не в тот словарь и ваше правило не сработает или сломает что то. Когда вы разберетесь как и почему такое произошло, изучите словари, разберетесь что такое rex словарь, от чего зависит скорость его работы, что такое быстрый алгоритм и алгоритм перебора для dic словарей, плюсы и минусы каждого, разность в скорости обработки текста посмотрите какой метод для какого словаря применяется, сами создадите кучу правил, только тогда будет понятна почему была выбрана такая последовательность. и почему луче скриптом пользоваться, а не стандартным Демагоговским способом. С этими словарями я эксперементировал год если не больше. И до сих пор эксперементирую. И то что есть сейчас -это самое лучшее что я смог оптимизировать за год. Многое упирается не в сами в словари, а в содержащихся в них правилах. Просто поверьте на слово что так более менее оптимально сделано. И объяснить что и почему так надо я физически не смогу.
Скажу в одним предложением: словари имеют именно такую последовательность и алгоритм через скрипт к каждому словарю выбран именно такой,- что бы получить баланс между скоростью и последовательностью срабатывания правил.
P.S. словари за основу были взяты от waska и тот алгоритм который он применяет меня со временем не устроил. Поэтому я в свое время отделился и пошел своим путём.
Отредактировано.
good_cat.
Yandex TTS
Добавлено: 19 июл 2019 14:51
good_cat
! | Сообщение из: good_cat |
lplee, на бан напрашиваетесь? Читайте внимательно правила форума. Следующего предупреждения не будет, уйдете в творческий отпуск для составления инструкций. Сообщение удалено. |
Yandex TTS. Словари. Обсуждение
Добавлено: 22 июл 2019 14:30
alex
tonio_k писал(а): ↑18 июл 2019 17:04
Простые замены:
Слава=Саша
Добавляйте в 58_Яндекс+пост обработка.dic
Скажите, почему вы в словаре меняете слова типа "кто-то" "что-то"на "кто-тэ" "что-тэ" насколько я убедился из всех;
"кто то"
"кто тэ"
"кто-то" именно "кто-то"звучит наиболее естественно.И что-то тоже. На других словах не проверял.
И ещё вопрос зачем в таких словах удаляют тире "-"
что-то.что-то.что-то.что-то.
что тэ. что тэ. что тэ..что тэ.
что то. что то. что то. что то.
кто-то. кто-то. кто-то. кто-то.
кто-тэ. кто-тэ. кто-тэ. кто-тэ.
Yandex TTS. Словари. Обсуждение
Добавлено: 22 июл 2019 15:19
tonio_k
Это рудименты которые улучшают звучание Максима
http://i91650e3.beget.tech/viewtopic.php?f=5&t= ... 1%8A#p1727
В Яндексе прослушивал эти слова с изменением "то" на "тэ" или на "та" звучит, на мой слух, благозвучнее.
Удаляются "тире между словами" в 90_REX_доп обработка.rex Под раздачу попадают и что-то и кто-то
Поэтому в папке dic2 файл 20_Ё-фикатор.dic и в шапке посмотреть - там есть слова, где резервируются исключения что бы не попасть под эту замену.
Можно там поправить или добавить те связки которые вам нужно зарезервировать
Но есть одно но. Если вы "что то" Замените например на "чт+ото", то
в последующих словарях например подробное правило:
что то в глаза попало=что то в глазА попало
Уже никогда не сработает
Потому что в тексте слова что то после замены самом начале уже не существует.
Поэтому если вас что-то не устраивает в звучание или в замене сделайте эту замену в словаре: 58_Яндекс+пост обработка.dic добавьте обратно изменяющее поравило в стиле:
что тэ=что-то
Теперь никаких проблем не должно быть
Yandex TTS. Словари. Обсуждение
Добавлено: 22 июл 2019 16:45
alex
кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то
Я понял и вот так изменил.А в этом словаре в 58-м свои добавления лучше по алфавиту
рассовывать или можно вниз словаря всё прописать?
Yandex TTS. Словари. Обсуждение
Добавлено: 22 июл 2019 17:01
tonio_k
alex писал(а): ↑22 июл 2019 16:45
кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то
добавлю в следующую сборку
alex писал(а): ↑22 июл 2019 16:45
рассовывать или можно вниз словаря всё прописать?
свои правила лучше в самый низ.
А перед своими правилами в виде шапки вставить комментарий через # Например:
Код: Выделить всё
#это мои словари. Сохранить при переносе в другую сборку!
кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то
В следующей сборке добавлю пустые словари и пропишу их в скрипте что бы они подхватывались. В эти словари будете добавлять свои правила что бы вносить свои изменения.
Yandex TTS. Словари. Обсуждение
Добавлено: 22 июл 2019 17:36
alex
tonio_k писал(а): ↑22 июл 2019 17:01
В следующей сборке добавлю пустые словари и пропишу их в скрипте что бы они подхватывались. В эти словари будете добавлять свои правила что бы вносить свои изменения.
Да это было бы круто,а то каждый раз думаешь как бы что не сломать.
Yandex TTS. Словари. Обсуждение
Добавлено: 22 июл 2019 17:53
tonio_k
В принципе вы уже сейчас можете сделать это. Все очень просто. Для этого:
1) Откройте папку
dic,
2) Создайте копию файла
58_пост обработка.dic
3) Переименуйте созданную копию файла, например, в
60_МОЙ СЛОВАРЬ.dic - и удалите его содержимое.
4) Перенесите свои правила в этот новый словарь, сохраните
5) Откройте
СПИСОК СЛОВАРЕЙ.lua
6) найдите строку:
Код: Выделить всё
WFilter(0,0,dic..'58_пост обработка.dic',false) -- перебором (галочка убрана)
7)сделайте прямо под ней её копию
8)Переименуйте в
60_МОЙ СЛОВАРЬ.dic что бы получилось уже 2 строки:
Код: Выделить всё
WFilter(0,0,dic..'58_пост обработка.dic',false) -- перебором (галочка убрана)
WFilter(0,0,dic..'60_МОЙ СЛОВАРЬ.dic',false) -- перебором (галочка убрана)
Ваш пользовательский словарь готов и будет теперь автоматом подхватываться скриптом при обработке словарями.
Yandex TTS. Словари. Обсуждение
Добавлено: 22 июл 2019 18:32
alex
вроде получилось работает !
► Показать
- Screenshot_1.png (99.95 КБ) 28116 просмотров
Yandex TTS. Словари. Обсуждение
Добавлено: 22 июл 2019 18:38
tonio_k
alex писал(а): ↑22 июл 2019 18:32
вроде получилось работает !
то что у вас выводит через показать измененный текст - это одно, а то что выводит через скрипт это другое. Вы можете сколько угодно добавлять словари в папке dic, Но если это не прописано в самом скрипте, то эти словари будут игнорироваться. Попробуйте запустить именно скрипт к окну и посмотреть какой будет результат в окне статистики
Yandex TTS. Словари. Обсуждение
Добавлено: 22 июл 2019 18:54
alex
tonio_k писал(а): ↑22 июл 2019 18:38
Попробуйте запустить именно скрипт к окну и посмотреть какой будет результат в окне статистики
было
► Показать
- Screenshot_2.png (82.8 КБ) 28110 просмотров
стало
► Показать
- Screenshot_3.png (105.28 КБ) 28110 просмотров
файл словаря
► Показать
- Screenshot_4.png (20.28 КБ) 28110 просмотров
Yandex TTS. Словари. Обсуждение
Добавлено: 22 июл 2019 19:24
AndOSjZ
Сейчас на скорую руку сделал небольшой эксперимент(т.е. взял маленький текст)обработал в Балаболка словарями для RHVoice с сайта ГолосКниги озвучил Yandex(Захар,Оксана)результат,вы знаете,впечатлил,надо только добавить обработку ц ,у RHVoice нет такой проблемы
P.S. Забыл,в изменённом тексте произвести замену Q на + ,заменить все
Yandex TTS. Словари. Обсуждение
Добавлено: 22 июл 2019 19:40
good_cat
Просьба иллюстрации убирать под спойлер.
Yandex TTS. Словари. Обсуждение
Добавлено: 23 июл 2019 15:36
alex
tonio_k писал(а): ↑22 июл 2019 18:38
вроде получилось работает !
Тогда всЪё будет хорошо для него и тебя.
После обработки словарями получается такая ошибка яндекс её не читает.
Причём распаковал новую программу из архива.Подскажите как её убрать у меня в моём словаре не получилось пробовал так: "всъё=всё"
Yandex TTS. Словари. Обсуждение
Добавлено: 23 июл 2019 17:02
tonio_k
ошибка в словаре
20_Яндекс+REX_Замены от waska.rex
найдите 2 строчки начинающиеся со значка решётки # в разделе
###все,всем
Код: Выделить всё
#(\bвс)(е\b)([^.,:;!?-]{0,25})(ался|ание|ееся|ется|еться|ится|ось|уюся|шем|шься|яние|своё)\b=$1ё$3$4
и удалите их.
Yandex TTS. Словари. Обсуждение
Добавлено: 23 июл 2019 17:55
alex
tonio_k писал(а): ↑23 июл 2019 17:02
ошибка в словаре 20_Яндекс+REX_Замены от waska.rex
ошибка устранилась сама собой ничего не менял, видимо во временных файлах было что то.
выяснил следующее яндех неправильно ставит ударение в слове
"скажи"
он произносит "ск+ажи" на первом слоге, это после обработки словарями без словарей ставит правильно.Но словари это слово не меняют.
Также "пожалуйста" яндех произносит правильно, а после обработки нет.
словарь меняет это слова на "пожалуста" но и его янд читает правильно, загадка!
вилимо влияет окружающие слова.
Yandex TTS. Словари. Обсуждение
Добавлено: 26 июл 2019 06:08
AndOSjZ
tonio_k
На компе обработал книгу в вашей последней сборке(скрипт 10...)потом на смарт в Acrow и ...я очень доволен,вы молодец
Yandex TTS. Словари. Обсуждение
Добавлено: 02 авг 2019 12:43
tonio_k
Демагог+Yandex TTS - Критическая ошибка в словарях. Откройте словарь 50_ОМОГРАФЫ 1 Омо.dic найдите в нем строку стороны озера=со сторонЫ Озера и змените на: со стороны озера=со сторонЫ Озера. Иначе при срабатывании этого правила будет зависание. В след обнове поправлю
Yandex TTS. Словари. Обсуждение
Добавлено: 03 авг 2019 15:25
Sylvia
Скачала Demagog-Yandex_2019-07-18.zip. Простите, можно задать пару глупых вопросов? Честно читала форум, ответов для себя не нашла
1. Не могу понять - нужно ли ставить галочки в окне словарей? пробовала с ними и без, даже если галки не стоят, то все равно текст обрабатывается словарями. Долгие годы пользовалась Балаболкой, в ней, если галки не стояли, то словари не принимались во внимание.
2. Мне нужно записать книгу в мр3. Если выбрать скрипт 11_ОКНО ЗАПИСАТЬ В MP3 (YandexTTS).lua , то не надо предварительно выбирать скрипты 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua и 10_ОКНО ОБРАБОТАТЬ СЛОВАРЯМИ.lua ? Если я правильно поняла, то эта предварительная обработка все равно проходит?
То есть, для качественной записи аудиокниги нужно выбрать голос, открыть текстовый файл в окне и выбрать скрипт 11? Или скрипт 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua тоже запускать?
Заранее спасибо и извините за бестолковость.
Yandex TTS. Словари. Обсуждение
Добавлено: 03 авг 2019 22:14
tonio_k
Sylvia писал(а): ↑03 авг 2019 15:25
1. Не могу понять - нужно ли ставить галочки в окне словарей?
если книга обработается через скрипты, то в самом скрипте прописаны словари в нужной последовательности. Так что при работе скриптов, галочки в панели словарей ни на что не влияют.
Sylvia писал(а): ↑03 авг 2019 15:25
Долгие годы пользовалась Балаболкой, в ней, если галки не стояли, то словари не принимались во внимание.
в Демагоге в штатном режиме (т.е. не через скрипты)- всё точно так же. Если вы хотите обработать текст в штатом режиме (активируя словари галочками), то только в этом и
только в этом случае надо запустить скрипт 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua больше он нигде не нужен. Этот скрипт запускает словари, находящиеся в папке dic2. Они спрятаны отдельно от папки dic что бы не смешившись с основными словарями. А согласно логике схемы срабатывания словарей эти словари должны сработать самыми первыми. Поэтому они отнесены в категорию первичная обработка.
Sylvia писал(а): ↑03 авг 2019 15:25
То есть, для качественной записи аудиокниги нужно выбрать голос, открыть текстовый файл в окне и выбрать скрипт 11?
да всё правильно. И голос можно выбрать и сохранить только один раз. Скрипт с настройками Яндекс голос не обязательно запускать каждый раз - только если надо его поменять.
Yandex TTS. Словари. Обсуждение
Добавлено: 03 авг 2019 23:21
Sylvia
tonio_k, Все понятно, спасибо Вам за сборку и разъяснение
Обнаружился единственный непонятный момент (но это не по словарям) - почему-то у некоторых голосов меняется интонация и высота, голос внезапно становится женским. Хотя выбрана нейтральная эмоция. Мягко говоря, напрягает... Для сравнения записала один и тот же отрывок разными голосами, так этот глюк присутствует не у всех.
Yandex TTS. Словари. Обсуждение
Добавлено: 26 авг 2019 01:02
tonio_k
Демагог+Yandex TTS - сборка от
2019-08-26 для подготовки книг и озвучивания Яндекс голосом на базе программы Демагог.
Словари любезно предоставленные ув. wasyaka
Получение mp3 от Яндекса через
скрипт от balaamster
Изменения:
► Показать
Обновлен скрипт от balaamster. Черный экран отображения потоков должен быть только один - никаких частых мельканий для каждого склеиваемого MP3-файла.
Добавлено автоматическое разбитие больших абзацев, теперь во временной папке не будут оставаться необработанные Яндексом файлы по причине их слишком большого размера.
Добавлена возможность прервать скрипт во время его работы со словарями через горячую клавишу (Ctrl+P).
Несколько скриптов работающих по одному принципу объединены в один с добавлением диалога выбора дальнейших действий.
Убрано выскакивающее сообщение о текущих выполняемых процессах и перенесено в статус строку в нижней части экрана Демагога.
В целом немного увеличена скорость обработки словарями.
Добавлены пользовательские словари ..._МОЙ СЛОВАРЬ в общий список словарей, куда можно заносить свои правила чтобы не смешивать с правилами сборки.
Yandex TTS. Словари. Обсуждение
Добавлено: 26 авг 2019 16:57
tonio_k
skreb писал(а): ↑26 авг 2019 16:44
1. Из сборки исчезли скрипты "10_ОКНО ОБРАБОТАТЬ СЛОВАРЯМИ.lua"
Выбираете:
10_ОКНО ОБРАБОТАТЬ СЛОВАРЯМИ И ЗАПИСАТЬ В MP3 YaTTS,
далее выбираете пункт: " ДЛЯ ПРОСЛУШИВАНИЯ В ACROW", Получаете обработанный словарями файл. Вносите свои изменения и к текущему окну запускаете:
40_ПОВТОРНО (при сбое) ЗАПИСАТЬ В MP3 YaTTS
skreb писал(а): ↑26 авг 2019 16:44
2. Словарь "80_Паузы" стал обрабатывать текст по другому.
Ошибся. Исправил. Перезалил.
Yandex TTS. Словари. Обсуждение
Добавлено: 26 авг 2019 17:08
tonio_k
По всей видимости я немного перемудрил с текстом диалогом выбора.
Сделал как было раньше по смыслу:
► Показать
- 2019-08-26_17-05-21.png (45.46 КБ) 27457 просмотров
Yandex TTS. Словари. Обсуждение
Добавлено: 26 авг 2019 19:04
AndOSjZ
tonio_k
из словаря 58... удалил строку тоъ=тэ и не надо в доп. словарях городить типа кто тэ=кто то и тому подобное
Yandex TTS. Словари. Обсуждение
Добавлено: 26 авг 2019 20:59
tonio_k
AndOSjZ писал(а): ↑26 авг 2019 19:04
из словаря 58... удалил строку тоъ=тэ
тоъ встречается неоднократно в словарях 50, 52, 53..
Вообще, "тоъ" появляется на этапе первичной обработки. И под эту самую "тоъ" и подгонялись словари 50,52,53. Удачное ли это решение или нет - вопрос дискутивный. Однако если вы удалите правило тоъ=тэ будет на слух озвучено чёткое тО вместо "та".
Можете попробовать заморочиться и заменить все правила с тоъ во всех словарях на то, но при этом нужно будет добавть дубль этого правила с одним отличием - добавить еще вариант и с тире перед "то". Надеюсь понятно сформулировал)))
в 58 Лучше исправить так: поднять правило тоъ=тэ выше:
тоъ=тэ
кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то
Yandex TTS. Словари. Обсуждение
Добавлено: 26 авг 2019 21:50
AndOSjZ
кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то
дело не только в них,в текстах много других то ,я то,вам то,ну и т. п. и с тэ звучат не очень
Послушаю как оно в таком варианте
Yandex TTS. Словари. Обсуждение
Добавлено: 26 авг 2019 22:03
tonio_k
Можно попробовать создать такого рода правила:
#
$*а тэ=а-то
$*б тэ=б-то
$*в тэ=в-то
...
И т.д. по алфавиту.
# и отдельно только для гласных на случай если подставились ударения:
$*А тэ=А-то
$*Е тэ=Е-то
$*О тэ=О-то
...
И т.д. *И *Ё *Ю ...
Т.е. возвращаем обратно тире на место как было.
Yandex TTS. Словари. Обсуждение
Добавлено: 26 авг 2019 22:28
AndOSjZ
А в каком словаре эти тире удаляются?
Yandex TTS. Словари. Обсуждение
Добавлено: 26 авг 2019 22:54
tonio_k
AndOSjZ писал(а): ↑26 авг 2019 22:28
А в каком словаре эти тире удаляются?
dic2\00_REX_подготовка текста.rex
Код: Выделить всё
# Удаление тире внутри слова типа: "точь-в-точь" или "из-за"
(\w+)-то\b=$1-тоъ
(\w+)\-(\w+)\-(\w+)=$1 $2 $3
(\w+)\-(\w+)=$1 $2
Yandex TTS. Словари. Обсуждение
Добавлено: 26 авг 2019 23:19
AndOSjZ
Прослушал yandex,ivona,vocalizer и все говорят нормально кто-то, что-то, наконец-то и т.п. если между буквами и тире нет пробелов
или пишутся слитно