Acapela (Elan) SpeechCube 5.1
- Fenix
- Администратор
Acapela (Elan) SpeechCube 5.1
Русский голосовой движок Николай
Версия: Мультимедиа 5.1
Разработчик: Acapela Elan
Платформа: Windows
Новая версия известного голосового движка Nikolaj от Digalo. Русский модуль голосового движка версии 5.1 от Acapela, это новый синтезатор речи TTS из серии "digalo". Голос тот же, «Николая» - Speech Cube Russian(Nicolai 16khz).
Качественно само произношение практически не изменилось, но излечился от некоторых старых болезней: теперь не сбоит на глючных словах и длинных паузах, позволяет записывать речь с ускорением, намного шире диапазон настраиваемых параметров речи.
Значительно расширен и частотный диапазон нового "Николая": от голоса человека, перенесшего трахеотомию, до кастрированного в раннем детстве старика.
Возможность подключения других словарей.
Acapela (Elan) SpeechCube 5.1 (Николай)
Для открытия файла(ов) нужен пароль
Словари (Николай)
Отличие в восприятии в читаемом тексте символа "<".
Мультимедийная версия воспринимает его как начало любого из управляющих SAPI-5 XML тэгов, вследствие чего следующая за этим символом часть текста проглатывается.
Телекомовская версия воспринимает его как ударение.
Соответственно, в программах-чтецах, использующих предварительную обработку текста своими собственными словарями лучше использовать Телекомовскую версию.
Мультимедийная версия подойдёт в случае, если программа-чтец не использует своих собственных словарей, и при чтении/записи используются только родные встроенные словари голосового движка (exc_rus.txt, abb_rus.txt).
Версия: Мультимедиа 5.1
Разработчик: Acapela Elan
Платформа: Windows
Новая версия известного голосового движка Nikolaj от Digalo. Русский модуль голосового движка версии 5.1 от Acapela, это новый синтезатор речи TTS из серии "digalo". Голос тот же, «Николая» - Speech Cube Russian(Nicolai 16khz).
Качественно само произношение практически не изменилось, но излечился от некоторых старых болезней: теперь не сбоит на глючных словах и длинных паузах, позволяет записывать речь с ускорением, намного шире диапазон настраиваемых параметров речи.
Значительно расширен и частотный диапазон нового "Николая": от голоса человека, перенесшего трахеотомию, до кастрированного в раннем детстве старика.
Возможность подключения других словарей.
Acapela (Elan) SpeechCube 5.1 (Николай)
Для открытия файла(ов) нужен пароль
► Показать
Отличие в восприятии в читаемом тексте символа "<".
Мультимедийная версия воспринимает его как начало любого из управляющих SAPI-5 XML тэгов, вследствие чего следующая за этим символом часть текста проглатывается.
Телекомовская версия воспринимает его как ударение.
Соответственно, в программах-чтецах, использующих предварительную обработку текста своими собственными словарями лучше использовать Телекомовскую версию.
Мультимедийная версия подойдёт в случае, если программа-чтец не использует своих собственных словарей, и при чтении/записи используются только родные встроенные словари голосового движка (exc_rus.txt, abb_rus.txt).
- vizaritm
- Интересующийся
Acapela (Elan) SpeechCube 5.1
Может кто выложить народный словарь с www.mp3book2005.narod.ru для движка Николай, сайт увы умер. Там был exc_rus.txt для замены где то на 5к Кб, на рутрекере есть что то подобное прилепленное к балаболке, но это что то из старого. Этот файл как нибудь бы надо сохранить, что бы не терялся, на сайте наверное?
Еще надо бы в шапку добавить реферную ссылку на эту тему желательно viewtopic.php?f=23&t=92, а то как то не очевидно, специально искать не найдешь. Тут словари на движок Николай, причем потестил, достаточно нормальные.
Еще надо бы в шапку добавить реферную ссылку на эту тему желательно viewtopic.php?f=23&t=92, а то как то не очевидно, специально искать не найдешь. Тут словари на движок Николай, причем потестил, достаточно нормальные.
- MoppoH
- Обыватель
Acapela (Elan) SpeechCube 5.1
127.000 выражений в нем, файл от 2013 года
- Вложения
-
- exc_rus.zip
- (913.58 КБ) 865 скачиваний
- EXEg
- Прохожий
Acapela (Elan) SpeechCube 5.1
Вот какой то словарь у меня завалялся (exc_rus.txt 5,16 МБ) возможно тот самый "народный" не проверял.
- Вложения
-
- exc_rus.7z
- (1003.8 КБ) 746 скачиваний
- regacaty
- Постоялец
Acapela (Elan) SpeechCube 5.1
Вот мой словарик, который не помню где взял, но от предыдущих отличается.
- balabolka
- V.I.P.
Acapela (Elan) SpeechCube 5.1
Возможно, стоит добавить в "шапку" темы ссылку на исправленный вариант библиотеки MTSYC32.DLL. После установки голоса этот файл надо скопировать с заменой в папку C:\Program Files (x86)\Elan\
- GIS88
- Обыватель
- balabolka
- V.I.P.
Acapela (Elan) SpeechCube 5.1
Насколько помню, голос перестает произносить "пространство", когда в тексте встречается неразрывный пробел. Возможно, что-то еще было исправлено.
Это не мой файл; скачал его с какого-то сайта.
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Возник вопрос при прослушивании переводов англоязычных книг. Как исправить словарь для чтения принятых обозначений времени в таких книгах? Примеры: чтобы "7:48" звучало как "семь часов и сорок восемь минут"; "19:05" - как "девятнадцать часов и пять минут".
- tonio_k
- V.I.P.
Acapela (Elan) SpeechCube 5.1
levm, попробуйте такой вариант замены для *.rex словаря
Код: Выделить всё
(\d):(\d\d):(\d\d)=$1 часов и $2 минут и $3 секунд
(\d):(\d\d)=$1 часов и $2 минут
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Спасибо, tonio_k!
Попробовал, и звучание "часов" и "минут" не появилось .
Попробовал, и звучание "часов" и "минут" не появилось .
- tonio_k
- V.I.P.
Acapela (Elan) SpeechCube 5.1
У меня замена работает.
► Показать
У вас вообще замена текста происходит? Может какой-то словарь у вас, например, скрыто меняет ":" на пробел? Тогда да, замена не сработает. Что у вас "там" со словарями к сожалению не видно Выложите в архив свою сборку со словарями - посмотрим что там не так.
*вообще выше приведенный мной пример правил замен не совершенный. Надо его расписывать что бы правильно подбиралось:
3 часа
13 часов
1 час
с минутами так же
- tonio_k
- V.I.P.
Acapela (Elan) SpeechCube 5.1
Можно через последующие корректирующие правила сделать:
тоже не идеально. Пример:
Код: Выделить всё
(\D)(3|4|03|04|23|24) часов\b=$1$2 часа
(\D)(1|01) часов\b=$1$2 час
(\D)(3|4|03|04|23|24|33|34|43|44|53|54) минут\b=$1$2 минуты
(\D)(1|01|21|31|41|51) минут\b=$1$2 минута
значит для таких случаев надо как-то прописывать/править в словарях..ЧЕРЕЗ 3 часа 21 минута
с 1 час до 3 часа
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Словари, в составе которых файл REX, скачал с http://golosknigi.com/page3.html . К ним добавил словарь, полученный от друга с этого форума. Прилагаю его, а также файл REX с добавкой.
Пояснение. Речь идет не об отрезках времени ("через" или "от... до"), а об одномоментном времени - как на электронных часах с мигающим двоеточием. Типа "19:45".
К файлу REX добавил Ваши строки:
Пояснение. Речь идет не об отрезках времени ("через" или "от... до"), а об одномоментном времени - как на электронных часах с мигающим двоеточием. Типа "19:45".
К файлу REX добавил Ваши строки:
- Вложения
-
- Sapi4_Elan_Nicolai_0.rar
- (8.13 КБ) 390 скачиваний
-
- Digalo Russian Nicolai.rar
- (272.19 КБ) 428 скачиваний
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Могу добавить, что двоеточие не введено у меня в настройках программы по списку игнорирования символов и замены на пробел.
- tonio_k
- V.I.P.
Acapela (Elan) SpeechCube 5.1
ещё уточняющий вопрос, какой программы? Балаболка/Демагог или ещё какая? Словари, архив которых выложили, все в папку со словарями программы разархивировали? Сделайте скриншот как у вас словари расположены в программе?
И вот ещё момент, сразу попробуйте мои правила разместить в самом первом словаре *.rex, или попробуйте создать свой пустой rex словарь, что бы он был первым по алфавиту и в него поместите правила.
К сожалению на этой неделе посмотреть ваши словарь скорее всего не смогу. Может кто другой раньше ответит?
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Балаболка 2.15.0.711.tonio_k писал(а): ↑07 мар 2020 22:34ещё уточняющий вопрос, какой программы? Балаболка/Демагог или ещё какая? Словари, архив которых выложили, все в папку со словарями программы разархивировали? Сделайте скриншот как у вас словари расположены в программе?
И вот ещё момент, сразу попробуйте мои правила разместить в самом первом словаре *.rex, или попробуйте создать свой пустой rex словарь, что бы он был первым по алфавиту и в него поместите правила.
Скриншот приложен с примером предложения с обозначением времени в тексте.
Словарь *.rex имеется только один, и он на первом месте.
Словарь, содержащий только Ваши правила и находящийся первым по алфавиту, не изменил звучания.
Различие в действии этих словарей (если их включать отдельно) только в том, что с прежним словарем пауза между звучаниями ЧИСЕЛ часов и минут была более длинной. Сами слова "...часов и ...минут" не звучали.
Спешного ответа не жду.
- Вложения
-
- Slovari.jpg (58.48 КБ) 41139 просмотров
- tonio_k
- V.I.P.
Acapela (Elan) SpeechCube 5.1
Посмотрел я ваш словарь. Вы не поняли мою последовательность мысли.
Вам надо сначала ввести правило из моего сообщения #10, а затем корректирующее его правила из моего сообщения #13 что бы у вас получилось :
И еще замечание, автор сайта, на который вы ссылались, настоятельно рекомендует не использовать другие словари кроме его. С чем я абсолютно согласен! Не стоит не понимая принципа построения словарей конкретной сборки вставлять другие словари из других сборок. Такое вмешательство может привести к непредвиденным результатам. Так что словарь Digalo Russian Nicolai.dic удалите (либо галочку отключите).
Вам надо сначала ввести правило из моего сообщения #10, а затем корректирующее его правила из моего сообщения #13 что бы у вас получилось :
► Показать
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
tonio_k, Вы - настоящий мастер! Действительно, я неправильно понял. Ваши правила сразу же заработали. Даже независимо от удаления/отключения словаря Digalo Russian Nicolai (сравнил оба варианта)!
Единственное отклонение от точного чтения - дополнительно звучит неизвестно откуда появившаяся буква А.
Т. е. слышится так:
7:48 семь часов и сорок восемьА минут
19:05 девятнадцать часов и пятьА минут
19:45 девятнадцать часов и сорок пятьА минут
Но в принципе получилось почти идеально
Единственное отклонение от точного чтения - дополнительно звучит неизвестно откуда появившаяся буква А.
Т. е. слышится так:
7:48 семь часов и сорок восемьА минут
19:05 девятнадцать часов и пятьА минут
19:45 девятнадцать часов и сорок пятьА минут
Но в принципе получилось почти идеально
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Спасибо, Manariel 64! Попробовал, выключив правила tonio_k. Файл Числа.rex, к сожалению, не поддержал идею добавления слов "часов" и "минут" к звучанию чисел времени.
Хотел бы дать Вам совет: когда архивируете, очень желательно добавлять в архив информацию для восстановления. Тогда никогда не будет трудностей разархивировать его.
- tonio_k
- V.I.P.
Acapela (Elan) SpeechCube 5.1
Попробуйте в словаре Sapi4_Elan_Nicolai_0.rex найти правило:
Код: Выделить всё
\b(\d{1,4}) \b(минута|минуты|минут|мин\.|мин)\b=$1 ъаъ $2
- это деактивирует выбранное правило без его удаления.
- tonio_k
- V.I.P.
Acapela (Elan) SpeechCube 5.1
а если в правиле:
удалить запятую, то исчезнет ненужная пауза между "7" и "часов"
Код: Выделить всё
\b(\d{0,3})(0|5|6|7|8|9) часов\b=$1$2, ъъчасо<въъ
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
tonio_k, одно только можно сказать: Вы умеете достичь совершенства. Буква А исчезла !
- Manariel 64
- Постоялец
Acapela (Elan) SpeechCube 5.1
levm,
Странно, у меня говорит. Впрочем я сильно не заморачиваюсь. Мне достаточно и без "часов-минут". Просто пятнадцать:сорок пять, например. Кстати попробовал правило tonio_k, тоже получается.
Странно, у меня говорит. Впрочем я сильно не заморачиваюсь. Мне достаточно и без "часов-минут". Просто пятнадцать:сорок пять, например. Кстати попробовал правило tonio_k, тоже получается.
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Manariel 64, это о букве А? У меня было так:
ВСЕ правила tonio_k добавил так, как он предложил:
а потом - поправки в файле
Так сработало.
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Непонятно, можно ли в Балаболке УМЕНЬШИТЬ паузу между словами. На форуме предлагается вставлять выражение типа {{Pause=2000}} в текст (тогда я добавил {{Pause=10}}), но оно только ДОБАВЛЯЕТ указанное время паузы к обычной (после остановки), т. е. пауза увеличивается. Обратил на это внимание, когда сочетание двух слов само по себе звучит с нормальной паузой между ними, но, находясь в середине предложения, неожиданно удлиняет эту паузу.
- balabolka
- V.I.P.
Acapela (Elan) SpeechCube 5.1
levm
Я сам не проверял, но есть теория, что если написать:
то можно переместиться во времени на 2 секунды в прошлое.
Если серьезно, то эта запись просто вставляет тег "Silence" для голосов SAPI 5:
Уменьшить паузу между словами таким способом нельзя.
Почему появляется пауза внутри предложения - не знаю. Если речь об онлайн-сервисах, то, возможно, программа разделила слишком длинное предложение на две части и каждую часть текста послала как отдельный запрос к серверу (на месте "стыка" появится пауза). Если речь о голосе "Николай", то у меня нет предположений.
Я сам не проверял, но есть теория, что если написать:
Код: Выделить всё
{{Pause=-2000}}
Если серьезно, то эта запись просто вставляет тег "Silence" для голосов SAPI 5:
Код: Выделить всё
<silence msec="2000"/>
Почему появляется пауза внутри предложения - не знаю. Если речь об онлайн-сервисах, то, возможно, программа разделила слишком длинное предложение на две части и каждую часть текста послала как отдельный запрос к серверу (на месте "стыка" появится пауза). Если речь о голосе "Николай", то у меня нет предположений.
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
В книгах с ссылками на исторические события характерны множественные римские числа веков или периодов веков. Словари не справляются с ударениями их правильного озвучивания, поэтому очень хороша была бы команда полуавтоматической обработки для таких чисел по аналогии с удачной "Заменить числа словами..." .
- tonio_k
- V.I.P.
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Нашел решение: выделил сочетания таких чисел со словами в отдельный словарь и сместил его в начало списка словарей. Тогда начало срабатывать.
- balabolka
- V.I.P.
Acapela (Elan) SpeechCube 5.1
Добавлю "галочку" для поиска римских чисел в окно поиска и замены чисел в "Балаболке". Давно собирался это сделать, руки не доходили; спасибо за идею.
Но также согласен, что подобные случаи можно вынести в отдельный словарь, так будет эффективней. Диапазон римских чисел, который используется в книгах, - это обычно от 1 до 50, так что вполне можно перечислить в словаре все сочетания чисел с "веками", "тысячелетиями", именами монархов и т.д. Один раз подготовить такой словарь или взять готовый, и проблема будет решена.
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Интересно, можно ли как-то вставлять КОРОТКИЕ паузы в концах стихотворных строк, если там, в концах, нет знаков препинания? Николай почти всегда не оставляет НИКАКИХ пауз в таких случаях. Например:
Зачем считать меня? Я был, и есть, и буду.
Жизнь — чудо из чудес, и на ладони чуду
Один, как сирота, я сам себя кладу,
Один среди зеркал в ограде отражений
Морей и городов, лучащихся в чаду.
Зачем считать меня? Я был, и есть, и буду.
Жизнь — чудо из чудес, и на ладони чуду
Один, как сирота, я сам себя кладу,
Один среди зеркал в ограде отражений
Морей и городов, лучащихся в чаду.
- tonio_k
- V.I.P.
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Вот это скоростная реакция профессионала! Спасибо, всё отлично, tonio_k
- tonio_k
- V.I.P.
Acapela (Elan) SpeechCube 5.1
более усложнённое правило:
должно сработать только на стихах или на что-то очень на них похожее, а именно: - если строка заканчивается на любую маленькую букву (допускается пробел на конце), а следующая строка "не пустая" и начинается с Большой буквы (допустимы пробелы перед большой буквой), то вставить запятую.
Я бы вообще такую последовательность рекомендовал:
первое правило будет искать стихи,
а второе будет искать что то вроде:
Пролог
Глава 1
1
2
и вставлять многоточие на конце каждой строки получая на выходе:
Пролог...
Глава 1...
1...
2..
тем самым заставляя Николая выделять "удлиненными паузами" нумерацию глав
Код: Выделить всё
@([а-яё]+)\b( *)([\r\n]{1,2})( *[А-ЯЁ])=$1,$3$4
Я бы вообще такую последовательность рекомендовал:
Код: Выделить всё
@([а-яё]+)\b( *)([\r\n]{1,2})( *[А-ЯЁ])=$1,$3$4
(\w+)(\s*)$=$1...$2
а второе будет искать что то вроде:
Пролог
Глава 1
1
2
и вставлять многоточие на конце каждой строки получая на выходе:
Пролог...
Глава 1...
1...
2..
тем самым заставляя Николая выделять "удлиненными паузами" нумерацию глав
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
1.
2.
Красиво.
2.
Будет удобно сначала вставлять многоточия, а потом заменять числа порядковыми числительными .
- levm
- Обыватель
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
tonio_k, появился новый вопрос, когда у Вас найдется время .
Как удлинить паузу (уже не в стихах, а в любом прозаическом тексте) для 2 знаков препинания : и ; Николай их отмечает при звучании сильно укороченными паузами, хотя по смыслу требуется хорошо выраженные паузы .
Как удлинить паузу (уже не в стихах, а в любом прозаическом тексте) для 2 знаков препинания : и ; Николай их отмечает при звучании сильно укороченными паузами, хотя по смыслу требуется хорошо выраженные паузы .
- tonio_k
- V.I.P.
- levm
- Обыватель
- tonio_k
- V.I.P.
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Попробовал, не удлинение пауз не ощутил. Может, как-то через REX будет лучше?
- tonio_k
- V.I.P.
Acapela (Elan) SpeechCube 5.1
Попробуйте сначала вручную заменить на точки в самом тексте и Просмотрите, есть ли разница?
- tonio_k
- V.I.P.
Acapela (Elan) SpeechCube 5.1
В словаре rex можно попробовать такую замену:
Код: Выделить всё
[:;]+=.
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Да, так лучше. По крайней мере особенно заметно по отношению к ";" и меньше для ":". Интересный случай: я для эксперимента поменял местами символы, т. е. получилось вместо
[;:]+=. , и тогда сработало ВСЁ ОДИНАКОВО. Большое спасибо, tonio_k.
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Интересно, какие трудности стоят перед программистами, составляющими словари ударений. Профанам непонятно, почему не удается автоматизировать их составление по текстам художественных произведений. Каждый такой текст, наверное, легко разделить на отдельные слова, а потом? Ведь одна часть словарей, более понятная, составляется по множеству слов с добавляемым единственным вариантом ударения. Другая - по сочетаниям омографов с примыкающими к ним спереди или сзади словами. Невозможен алгоритм поиска сочетаний с омографами?
- tonio_k
- V.I.P.
Acapela (Elan) SpeechCube 5.1
не программистами, а перед составителями словарей. Им может стать любой, а вот программистом далеко не каждый
этим как раз пытаются заниматься нейросети. Обычному пользователю остаётся заносить правила в словарях по старинкепочему не удается автоматизировать их составление по текстам художественных произведений.
в Балаболке и Демагоге есть полуавтоматический ручной поиск омографов. В контексте сразу видно, какие слова находятся вокруг найденого омографа. Остаётся только подставить правильный. Количество слов, отображаемых вокруг найденого омографа можно настраивать. Или другой вариант: подсвечивать омографы и по ходу пролистывания текста и исправлять на нужный.
- levm
- Обыватель
Acapela (Elan) SpeechCube 5.1
Вот на них-то и остается надежда, потому что
само занесение слов вручную упомянутыми вариантами лишает удовольствия от прослушивания желаемой книги. Любой предварительный поиск требует чтения предложений с омонимами, а поскольку последние встречаются очень часто, в процессе приходится читать многие предложения. Так мы узнаем много ПОДРОБНОСТЕЙ сюжета, поэтому при прослушивании уже не ощущается новизна восприятия. Многое уже хорошо известно, и интерес теряется.