Yandex TTS. Словари. Обсуждение
Yandex TTS
Да, именно в символе "&" было дело. А точнее, в словарях нашел правило:
&=.энд.
То есть, обрабатывались отдельно стоящие "&", а те, что внутри текста нет. Например такие:
"оля&вася".
Добавил в словарь:
*&*=.энд.
Теперь ок.
Yandex TTS
Вот как только разберусь со всем этим, напишу нормальную инструкцию, а то сейчас бардак, только без обид.
Инструкция будет не больше 2х листов формата А4, и там все будет понятно.
Отредактировано. good_cat.
Инструкция будет не больше 2х листов формата А4, и там все будет понятно.
Отредактировано. good_cat.
- good_cat
- Администратор
Yandex TTS
Рекомендую прекратить начало холиварных войн: что, где и как лучше.
Не внявшие будут награждены переводом в режим только для чтения.
Не внявшие будут награждены переводом в режим только для чтения.
- good_cat
- Администратор
Yandex TTS
lplee, Жду от вас инструкций. Месяца будет достаточно? Через месяц вернемся к этому вопросу.
Yandex TTS
Мм, не могу обещать, т.к. через пару недель еду в отпуск, а вопросы которые я бы хотел затронуть только увеличиваются, вот например по работе со словарями, ни в одной из справок я пока не видел про это. Но инструкция будет, теперь уже не отвертеться ;)
- good_cat
- Администратор
Yandex TTS
Обсуждение по теме "Омографы" просьба публиковать в теме "Омографы".
Сообщения перенесены в соответствующий раздел форума.
Сообщения перенесены в соответствующий раздел форума.
- alex
- Постоялец
Yandex TTS
Здравствуйте, не подскажете как и в какой словарь внести изменения.
Яндекс выдаёт ошибку когда в тексте встречается символ, вернее буква
& это английская и ,например Camden Bank & Trust.
Исключение при вызове "DownloadFile" с "2" аргументами: "Удаленный сервер возвратил ошибку: (400) Недопустимый запрос."
СВЕД.: 0123 не получен
и ещё например если я хочу слово (потом) заменить во всём тексте на слово (затем)
в какой словарь это воткнуть.
Яндекс выдаёт ошибку когда в тексте встречается символ, вернее буква
& это английская и ,например Camden Bank & Trust.
Исключение при вызове "DownloadFile" с "2" аргументами: "Удаленный сервер возвратил ошибку: (400) Недопустимый запрос."
СВЕД.: 0123 не получен
и ещё например если я хочу слово (потом) заменить во всём тексте на слово (затем)
в какой словарь это воткнуть.
Yandex TTS
В какой проге работаете? Какие словари есть?
Я в Демагоге, сборка то ли от Wasyka то ли от Тони, изменил в словаре "1.0_corector предв.dic":
Было: &=.энд.
Стало: *&*=.энд.
То есть, добавил звездочек, теперь норм.
Вообще вы можете свой словарь замен завести, прописав его в списке словарей. И не забывайте про порядок словарей! Чтобы правила обрабатывались последовательно и не мешали друг другу, но по этому поводу к Wasyka или Тони, они больше знают, тем более по своим сборкам
- tonio_k
- V.I.P.
Yandex TTS
не самое удачное решение. Пример:
При виде зверя он покрылся потом.
После замены:
При виде зверя он покрылся затем.
- alex
- Постоялец
Yandex TTS
да но иногда помогает если в тексте нет таких слов
А как можно - свой словарь замен завести, прописав его в списке словарей в демагоге.
- alex
- Постоялец
- tonio_k
- V.I.P.
Yandex TTS
Демагог+Yandex TTS - сборка от 2019-07-18 для подготовки книг и озвучивания Яндекс голосом на базе программы Демагог.
Обновлены словари для Яндекс. Словари любезно предоставленные ув. wasyaka
Рекомендации по добавлению своих правил в словари:
1) Правила в формате регулярных выражений добавляем в словарь:
- 30_Яндекс+REX_Замены пополнение.rex
2) Обычные правила с вставкой ударения за счёт изменения регИстра букв и прочие замены добавляем в словарь:
- 58_Яндекс+пост обработка.dic
3) Обычные правила с вставкой ударения за счёт вставки знака + для Яндекса добавляем в словарь:
- 72_Яндекс+слова.dic
Свои правила лучше держите в словаре в одной куче, не разбрасывайте их по словарям. Это для удобства их последующего перемещения в словари из сборки в сборку.
Не перезаписывайте сборку поверх старой - что бы не получить кашу. Сохраняйте отдельно.
Обновлены словари для Яндекс. Словари любезно предоставленные ув. wasyaka
Рекомендации по добавлению своих правил в словари:
1) Правила в формате регулярных выражений добавляем в словарь:
- 30_Яндекс+REX_Замены пополнение.rex
2) Обычные правила с вставкой ударения за счёт изменения регИстра букв и прочие замены добавляем в словарь:
- 58_Яндекс+пост обработка.dic
3) Обычные правила с вставкой ударения за счёт вставки знака + для Яндекса добавляем в словарь:
- 72_Яндекс+слова.dic
Свои правила лучше держите в словаре в одной куче, не разбрасывайте их по словарям. Это для удобства их последующего перемещения в словари из сборки в сборку.
Не перезаписывайте сборку поверх старой - что бы не получить кашу. Сохраняйте отдельно.
- alex
- Постоялец
Yandex TTS
да здесь не разберёшься, я к примеру хочу вместо слова потом вставить затем, или изменить имя слава на саша, мне в какой словарь вставлять в этот 30_Яндекс+REX_Замены пополнение.rex или свой маленький сделать под конкретный текст книги.в 30_Яндекс+REX_Замены пополнение.rex--я точно не разберусь.
- tonio_k
- V.I.P.
Yandex TTS
Простые замены:
Слава=Саша
Добавляйте в 58_Яндекс+пост обработка.dic
Лучше новые словари не создавать, пока не научились в скрипты вносить изменения под себя. Добавляйте правила в существующие словари.
Как устроены словари По какому принципу работает смотрите на форуме ветки Demagog а также на официальном сайте Demagog -там много и подробно расписано.
Слава=Саша
Добавляйте в 58_Яндекс+пост обработка.dic
Лучше новые словари не создавать, пока не научились в скрипты вносить изменения под себя. Добавляйте правила в существующие словари.
Как устроены словари По какому принципу работает смотрите на форуме ветки Demagog а также на официальном сайте Demagog -там много и подробно расписано.
Yandex TTS
Замечу один момент. Официально Яндекс ставит ударение через знак +: "с+аша", но и через регистр ударение меняется, но по другому. Наверное правильно сказать меняется тон, но во многих словах это звучит как поменяли ударение. Попробуйте сравнить например "сАша", "сашА", "саш+а".
Yandex TTS
tonio_k писал(а): ↑19 июл 2019 10:211) Правила в формате регулярных выражений добавляем в словарь:
- 30_Яндекс+REX_Замены пополнение.rex
2) Обычные правила с вставкой ударения за счёт изменения регИстра букв и прочие замены добавляем в словарь:
- 58_Яндекс+пост обработка.dic
3) Обычные правила с вставкой ударения за счёт вставки знака + для Яндекса добавляем в словарь:
- 72_Яндекс+слова.dic
Тк снова сумятица, я уточню.
Есть словари:
1. Регулярки
2. Ё
3. Ударения
4. Другие замены, например аббревиатуры.
Вы упоминули, что словари в сборках не желательно менять, чтобы в случае обновлений быстро перенести свои исправления. Давайте подумаем, куда девать свои замены?
Тк основные замены уже есть в словарях, очевидно своих будет не много, поэтому моя идея, завести 2 своих словаря: для регулярок rex, и обычный dic.
В обычном можно сделать разделение на все типы замен (кроме регулярок):
2. Ё.
3. Ударения.
4. Другие замены, например аббревиатуры.
Только нужно понять порядок следования замен, а также порядок подключения своих словарей, наверное после всех основных?
- tonio_k
- V.I.P.
Yandex TTS
вот это по другому - ставит как то не предсказуемо. "Плюс" - это 90% что ударение будет правильным не проверяя повторным прослушиванием, при этом, для надёжности, все буквы желательно перевести в нижний регистр.
Что касается словарей... Дело в том, что сборку делаю в каком то смысле "в слепую". Я не являюсь пользователем Яндекс голоса мне на слух ближе и понятнее Максим ivona (!не спорим о фломастерах!). У меня на руках наработки словарей waska + собственные наработки под голос Максим. Словари от waska оставил почти без изменений "как есть" так как он реальный слушатель Яндекса.
Все заморочки со словарями сборки, это попытки склеить его и мои наработки в единую неразрывную цепочку. Что бы при применении словарей к окну в стандартном режиме Демагога (при активации галочками словарей на панели словарей и нажать кнопку показать измененный текст) в результате получим точно такой же результат как при применении скрипта. Это необходимо при анализе как сработали правила.
Проблема одна - Демагог применяет словари сначала регулярки и лишь потом обычные словари. При этом, регулярки и обычные словари (при отключении соответствующей галочки) применяются внутри каждой группы между собой строго друг за другом по наименованию словаря. Собственно из за этой особенности и начались работы в сторону скриптов. Часто нужно именно чередование регулярки и обычных словарей. Было бы очень удобно если бы можно было устанавливать последовательность меняя названия словаря, но что имеем, с тем работаем. Потому и часть словарей в другой папке (dic2) и отдельный скрипт первичной обработки, который запускает словари из папки dic2 - без запуска которого, анализ правил будет не полным.
На счёт пользовательских словарей,
Я добавлю в сборку несколько пустых словарей с пометкой например "Мой словарь" и пропишу их в скриптах что бы они подхватывались. Останется их заполнять своими правилами. Одну регулярку и обычный словарь добавлю в скрытую папку. Одну регулярку после всех регулярок, один простой словарь до ударений, другой сразу после ударений.
Если буду что то менять в словарях по их названию - будет понятно какой нужно заменить своим.
Уточню, сборки меняю только если появляются изменения в алгоритмах скриптов. Когда создавал сборку, я думал, что один раз выложив, оставлю как есть.
Но, гляжу, эксперименты продолжаются. Наверное для таких случаев лучше действительно создать пустые словари для пользователей.
Yandex TTS
А где можно найти вашу последнюю сборку с Максимом?
Можно поподробнее тут? Я запускаю только один скрипт, не помню дословно, но ctrl+f2, "обработать словарями", как-то так, затем запись в мп3, все по вашей инструкции.
Сейчас вы говорите про ещё одну обработку через dic2, чем это делать?
Yandex TTS
Тут бы ещё мини-справку сделать, что к чему, почему именно такая последовательность, и зачем дублирование словарей до и после ударений и тд
- tonio_k
- V.I.P.
Yandex TTS
http://i91650e3.beget.tech/viewtopic.php?f=42&t=49#p55
http://i91650e3.beget.tech/viewtopic.php?t=59&start=250#p2519
я могу попробовать, но она будет такой поверхностной. Станет понятна только тогда, когда вы внесете правило не в тот словарь и ваше правило не сработает или сломает что то. Когда вы разберетесь как и почему такое произошло, изучите словари, разберетесь что такое rex словарь, от чего зависит скорость его работы, что такое быстрый алгоритм и алгоритм перебора для dic словарей, плюсы и минусы каждого, разность в скорости обработки текста посмотрите какой метод для какого словаря применяется, сами создадите кучу правил, только тогда будет понятна почему была выбрана такая последовательность. и почему луче скриптом пользоваться, а не стандартным Демагоговским способом. С этими словарями я эксперементировал год если не больше. И до сих пор эксперементирую. И то что есть сейчас -это самое лучшее что я смог оптимизировать за год. Многое упирается не в сами в словари, а в содержащихся в них правилах. Просто поверьте на слово что так более менее оптимально сделано. И объяснить что и почему так надо я физически не смогу.
Скажу в одним предложением: словари имеют именно такую последовательность и алгоритм через скрипт к каждому словарю выбран именно такой,- что бы получить баланс между скоростью и последовательностью срабатывания правил.
P.S. словари за основу были взяты от waska и тот алгоритм который он применяет меня со временем не устроил. Поэтому я в свое время отделился и пошел своим путём.
Отредактировано. good_cat.
- alex
- Постоялец
Yandex TTS. Словари. Обсуждение
Скажите, почему вы в словаре меняете слова типа "кто-то" "что-то"на "кто-тэ" "что-тэ" насколько я убедился из всех;
"кто то"
"кто тэ"
"кто-то" именно "кто-то"звучит наиболее естественно.И что-то тоже. На других словах не проверял.
И ещё вопрос зачем в таких словах удаляют тире "-"
что-то.что-то.что-то.что-то.
что тэ. что тэ. что тэ..что тэ.
что то. что то. что то. что то.
кто-то. кто-то. кто-то. кто-то.
кто-тэ. кто-тэ. кто-тэ. кто-тэ.
- tonio_k
- V.I.P.
Yandex TTS. Словари. Обсуждение
Это рудименты которые улучшают звучание Максима
http://i91650e3.beget.tech/viewtopic.php?f=5&t= ... 1%8A#p1727
В Яндексе прослушивал эти слова с изменением "то" на "тэ" или на "та" звучит, на мой слух, благозвучнее.
Удаляются "тире между словами" в 90_REX_доп обработка.rex Под раздачу попадают и что-то и кто-то
Поэтому в папке dic2 файл 20_Ё-фикатор.dic и в шапке посмотреть - там есть слова, где резервируются исключения что бы не попасть под эту замену.
Можно там поправить или добавить те связки которые вам нужно зарезервировать
Но есть одно но. Если вы "что то" Замените например на "чт+ото", то
в последующих словарях например подробное правило:
что то в глаза попало=что то в глазА попало
Уже никогда не сработает
Потому что в тексте слова что то после замены самом начале уже не существует.
Поэтому если вас что-то не устраивает в звучание или в замене сделайте эту замену в словаре: 58_Яндекс+пост обработка.dic добавьте обратно изменяющее поравило в стиле:
что тэ=что-то
Теперь никаких проблем не должно быть
http://i91650e3.beget.tech/viewtopic.php?f=5&t= ... 1%8A#p1727
В Яндексе прослушивал эти слова с изменением "то" на "тэ" или на "та" звучит, на мой слух, благозвучнее.
Удаляются "тире между словами" в 90_REX_доп обработка.rex Под раздачу попадают и что-то и кто-то
Поэтому в папке dic2 файл 20_Ё-фикатор.dic и в шапке посмотреть - там есть слова, где резервируются исключения что бы не попасть под эту замену.
Можно там поправить или добавить те связки которые вам нужно зарезервировать
Но есть одно но. Если вы "что то" Замените например на "чт+ото", то
в последующих словарях например подробное правило:
что то в глаза попало=что то в глазА попало
Уже никогда не сработает
Потому что в тексте слова что то после замены самом начале уже не существует.
Поэтому если вас что-то не устраивает в звучание или в замене сделайте эту замену в словаре: 58_Яндекс+пост обработка.dic добавьте обратно изменяющее поравило в стиле:
что тэ=что-то
Теперь никаких проблем не должно быть
- alex
- Постоялец
Yandex TTS. Словари. Обсуждение
кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то
Я понял и вот так изменил.А в этом словаре в 58-м свои добавления лучше по алфавиту
рассовывать или можно вниз словаря всё прописать?
кто тэ=кто-то
что то=что-то
что тэ=что-то
Я понял и вот так изменил.А в этом словаре в 58-м свои добавления лучше по алфавиту
рассовывать или можно вниз словаря всё прописать?
- tonio_k
- V.I.P.
Yandex TTS. Словари. Обсуждение
добавлю в следующую сборку
свои правила лучше в самый низ.
А перед своими правилами в виде шапки вставить комментарий через # Например:
Код: Выделить всё
#это мои словари. Сохранить при переносе в другую сборку!
кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то
- alex
- Постоялец
- tonio_k
- V.I.P.
Yandex TTS. Словари. Обсуждение
В принципе вы уже сейчас можете сделать это. Все очень просто. Для этого:
1) Откройте папку dic,
2) Создайте копию файла 58_пост обработка.dic
3) Переименуйте созданную копию файла, например, в 60_МОЙ СЛОВАРЬ.dic - и удалите его содержимое.
4) Перенесите свои правила в этот новый словарь, сохраните
5) Откройте СПИСОК СЛОВАРЕЙ.lua
6) найдите строку:
7)сделайте прямо под ней её копию
8)Переименуйте в 60_МОЙ СЛОВАРЬ.dic что бы получилось уже 2 строки:
Ваш пользовательский словарь готов и будет теперь автоматом подхватываться скриптом при обработке словарями.
1) Откройте папку dic,
2) Создайте копию файла 58_пост обработка.dic
3) Переименуйте созданную копию файла, например, в 60_МОЙ СЛОВАРЬ.dic - и удалите его содержимое.
4) Перенесите свои правила в этот новый словарь, сохраните
5) Откройте СПИСОК СЛОВАРЕЙ.lua
6) найдите строку:
Код: Выделить всё
WFilter(0,0,dic..'58_пост обработка.dic',false) -- перебором (галочка убрана)
8)Переименуйте в 60_МОЙ СЛОВАРЬ.dic что бы получилось уже 2 строки:
Код: Выделить всё
WFilter(0,0,dic..'58_пост обработка.dic',false) -- перебором (галочка убрана)
WFilter(0,0,dic..'60_МОЙ СЛОВАРЬ.dic',false) -- перебором (галочка убрана)
- alex
- Постоялец
- tonio_k
- V.I.P.
Yandex TTS. Словари. Обсуждение
то что у вас выводит через показать измененный текст - это одно, а то что выводит через скрипт это другое. Вы можете сколько угодно добавлять словари в папке dic, Но если это не прописано в самом скрипте, то эти словари будут игнорироваться. Попробуйте запустить именно скрипт к окну и посмотреть какой будет результат в окне статистики
- alex
- Постоялец
- AndOSjZ
- Постоялец
Yandex TTS. Словари. Обсуждение
Сейчас на скорую руку сделал небольшой эксперимент(т.е. взял маленький текст)обработал в Балаболка словарями для RHVoice с сайта ГолосКниги озвучил Yandex(Захар,Оксана)результат,вы знаете,впечатлил,надо только добавить обработку ц ,у RHVoice нет такой проблемы
P.S. Забыл,в изменённом тексте произвести замену Q на + ,заменить все
P.S. Забыл,в изменённом тексте произвести замену Q на + ,заменить все
- good_cat
- Администратор
- alex
- Постоялец
Yandex TTS. Словари. Обсуждение
Тогда всЪё будет хорошо для него и тебя.
После обработки словарями получается такая ошибка яндекс её не читает.
Причём распаковал новую программу из архива.Подскажите как её убрать у меня в моём словаре не получилось пробовал так: "всъё=всё"
- tonio_k
- V.I.P.
Yandex TTS. Словари. Обсуждение
ошибка в словаре 20_Яндекс+REX_Замены от waska.rex
найдите 2 строчки начинающиеся со значка решётки # в разделе
###все,всем
и удалите их.
найдите 2 строчки начинающиеся со значка решётки # в разделе
###все,всем
Код: Выделить всё
#(\bвс)(е\b)([^.,:;!?-]{0,25})(ался|ание|ееся|ется|еться|ится|ось|уюся|шем|шься|яние|своё)\b=$1ё$3$4
Код: Выделить всё
#\b(в)сё (\w+но|\w+лись)=$1се $2
- alex
- Постоялец
Yandex TTS. Словари. Обсуждение
ошибка устранилась сама собой ничего не менял, видимо во временных файлах было что то.
выяснил следующее яндех неправильно ставит ударение в слове
"скажи"
он произносит "ск+ажи" на первом слоге, это после обработки словарями без словарей ставит правильно.Но словари это слово не меняют.
Также "пожалуйста" яндех произносит правильно, а после обработки нет.
словарь меняет это слова на "пожалуста" но и его янд читает правильно, загадка!
вилимо влияет окружающие слова.
- AndOSjZ
- Постоялец
Yandex TTS. Словари. Обсуждение
tonio_k
На компе обработал книгу в вашей последней сборке(скрипт 10...)потом на смарт в Acrow и ...я очень доволен,вы молодец
На компе обработал книгу в вашей последней сборке(скрипт 10...)потом на смарт в Acrow и ...я очень доволен,вы молодец
- tonio_k
- V.I.P.
Yandex TTS. Словари. Обсуждение
Демагог+Yandex TTS - Критическая ошибка в словарях. Откройте словарь 50_ОМОГРАФЫ 1 Омо.dic найдите в нем строку стороны озера=со сторонЫ Озера и змените на: со стороны озера=со сторонЫ Озера. Иначе при срабатывании этого правила будет зависание. В след обнове поправлю
- Sylvia
- Постоялец
Yandex TTS. Словари. Обсуждение
Скачала Demagog-Yandex_2019-07-18.zip. Простите, можно задать пару глупых вопросов? Честно читала форум, ответов для себя не нашла
1. Не могу понять - нужно ли ставить галочки в окне словарей? пробовала с ними и без, даже если галки не стоят, то все равно текст обрабатывается словарями. Долгие годы пользовалась Балаболкой, в ней, если галки не стояли, то словари не принимались во внимание.
2. Мне нужно записать книгу в мр3. Если выбрать скрипт 11_ОКНО ЗАПИСАТЬ В MP3 (YandexTTS).lua , то не надо предварительно выбирать скрипты 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua и 10_ОКНО ОБРАБОТАТЬ СЛОВАРЯМИ.lua ? Если я правильно поняла, то эта предварительная обработка все равно проходит?
То есть, для качественной записи аудиокниги нужно выбрать голос, открыть текстовый файл в окне и выбрать скрипт 11? Или скрипт 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua тоже запускать?
Заранее спасибо и извините за бестолковость.
1. Не могу понять - нужно ли ставить галочки в окне словарей? пробовала с ними и без, даже если галки не стоят, то все равно текст обрабатывается словарями. Долгие годы пользовалась Балаболкой, в ней, если галки не стояли, то словари не принимались во внимание.
2. Мне нужно записать книгу в мр3. Если выбрать скрипт 11_ОКНО ЗАПИСАТЬ В MP3 (YandexTTS).lua , то не надо предварительно выбирать скрипты 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua и 10_ОКНО ОБРАБОТАТЬ СЛОВАРЯМИ.lua ? Если я правильно поняла, то эта предварительная обработка все равно проходит?
То есть, для качественной записи аудиокниги нужно выбрать голос, открыть текстовый файл в окне и выбрать скрипт 11? Или скрипт 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua тоже запускать?
Заранее спасибо и извините за бестолковость.
- tonio_k
- V.I.P.
Yandex TTS. Словари. Обсуждение
если книга обработается через скрипты, то в самом скрипте прописаны словари в нужной последовательности. Так что при работе скриптов, галочки в панели словарей ни на что не влияют.
в Демагоге в штатном режиме (т.е. не через скрипты)- всё точно так же. Если вы хотите обработать текст в штатом режиме (активируя словари галочками), то только в этом и только в этом случае надо запустить скрипт 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua больше он нигде не нужен. Этот скрипт запускает словари, находящиеся в папке dic2. Они спрятаны отдельно от папки dic что бы не смешившись с основными словарями. А согласно логике схемы срабатывания словарей эти словари должны сработать самыми первыми. Поэтому они отнесены в категорию первичная обработка.
да всё правильно. И голос можно выбрать и сохранить только один раз. Скрипт с настройками Яндекс голос не обязательно запускать каждый раз - только если надо его поменять.
- Sylvia
- Постоялец
Yandex TTS. Словари. Обсуждение
tonio_k, Все понятно, спасибо Вам за сборку и разъяснение
Обнаружился единственный непонятный момент (но это не по словарям) - почему-то у некоторых голосов меняется интонация и высота, голос внезапно становится женским. Хотя выбрана нейтральная эмоция. Мягко говоря, напрягает... Для сравнения записала один и тот же отрывок разными голосами, так этот глюк присутствует не у всех.
Обнаружился единственный непонятный момент (но это не по словарям) - почему-то у некоторых голосов меняется интонация и высота, голос внезапно становится женским. Хотя выбрана нейтральная эмоция. Мягко говоря, напрягает... Для сравнения записала один и тот же отрывок разными голосами, так этот глюк присутствует не у всех.
- tonio_k
- V.I.P.
Yandex TTS. Словари. Обсуждение
Демагог+Yandex TTS - сборка от 2019-08-26 для подготовки книг и озвучивания Яндекс голосом на базе программы Демагог.
Словари любезно предоставленные ув. wasyaka
Получение mp3 от Яндекса через скрипт от balaamster
Изменения:
Словари любезно предоставленные ув. wasyaka
Получение mp3 от Яндекса через скрипт от balaamster
Изменения:
► Показать
- tonio_k
- V.I.P.
Yandex TTS. Словари. Обсуждение
Выбираете:
10_ОКНО ОБРАБОТАТЬ СЛОВАРЯМИ И ЗАПИСАТЬ В MP3 YaTTS,
далее выбираете пункт: " ДЛЯ ПРОСЛУШИВАНИЯ В ACROW", Получаете обработанный словарями файл. Вносите свои изменения и к текущему окну запускаете:
40_ПОВТОРНО (при сбое) ЗАПИСАТЬ В MP3 YaTTS
Ошибся. Исправил. Перезалил.
- tonio_k
- V.I.P.
Yandex TTS. Словари. Обсуждение
По всей видимости я немного перемудрил с текстом диалогом выбора.
Сделал как было раньше по смыслу:
Сделал как было раньше по смыслу:
► Показать
- AndOSjZ
- Постоялец
Yandex TTS. Словари. Обсуждение
tonio_k
из словаря 58... удалил строку тоъ=тэ и не надо в доп. словарях городить типа кто тэ=кто то и тому подобное
из словаря 58... удалил строку тоъ=тэ и не надо в доп. словарях городить типа кто тэ=кто то и тому подобное
- tonio_k
- V.I.P.
Yandex TTS. Словари. Обсуждение
тоъ встречается неоднократно в словарях 50, 52, 53..
Вообще, "тоъ" появляется на этапе первичной обработки. И под эту самую "тоъ" и подгонялись словари 50,52,53. Удачное ли это решение или нет - вопрос дискутивный. Однако если вы удалите правило тоъ=тэ будет на слух озвучено чёткое тО вместо "та".
Можете попробовать заморочиться и заменить все правила с тоъ во всех словарях на то, но при этом нужно будет добавть дубль этого правила с одним отличием - добавить еще вариант и с тире перед "то". Надеюсь понятно сформулировал)))
в 58 Лучше исправить так: поднять правило тоъ=тэ выше:
тоъ=тэ
кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то
- AndOSjZ
- Постоялец
Yandex TTS. Словари. Обсуждение
кто то=кто-то
кто тэ=кто-то
что то=что-то
что тэ=что-то
дело не только в них,в текстах много других то ,я то,вам то,ну и т. п. и с тэ звучат не очень
Послушаю как оно в таком варианте
кто тэ=кто-то
что то=что-то
что тэ=что-то
дело не только в них,в текстах много других то ,я то,вам то,ну и т. п. и с тэ звучат не очень
Послушаю как оно в таком варианте
- tonio_k
- V.I.P.
Yandex TTS. Словари. Обсуждение
Можно попробовать создать такого рода правила:
#
$*а тэ=а-то
$*б тэ=б-то
$*в тэ=в-то
...
И т.д. по алфавиту.
# и отдельно только для гласных на случай если подставились ударения:
$*А тэ=А-то
$*Е тэ=Е-то
$*О тэ=О-то
...
И т.д. *И *Ё *Ю ...
Т.е. возвращаем обратно тире на место как было.
#
$*а тэ=а-то
$*б тэ=б-то
$*в тэ=в-то
...
И т.д. по алфавиту.
# и отдельно только для гласных на случай если подставились ударения:
$*А тэ=А-то
$*Е тэ=Е-то
$*О тэ=О-то
...
И т.д. *И *Ё *Ю ...
Т.е. возвращаем обратно тире на место как было.
- AndOSjZ
- Постоялец
- tonio_k
- V.I.P.
Yandex TTS. Словари. Обсуждение
dic2\00_REX_подготовка текста.rex
Код: Выделить всё
# Удаление тире внутри слова типа: "точь-в-точь" или "из-за"
(\w+)-то\b=$1-тоъ
(\w+)\-(\w+)\-(\w+)=$1 $2 $3
(\w+)\-(\w+)=$1 $2
- AndOSjZ
- Постоялец
Yandex TTS. Словари. Обсуждение
Прослушал yandex,ivona,vocalizer и все говорят нормально кто-то, что-то, наконец-то и т.п. если между буквами и тире нет пробелов
или пишутся слитно
или пишутся слитно