Программа работы со словарями замен Java_RU_text4tts
- Fenix
- Администратор
Программа работы со словарями замен Java_RU_text4tts
Автор темы: yra
Aug 29 2017
Не могу избавиться от идем готовить тексты к произношению голосовым движком прямо на Android... т.к. слушаю аудиокниги с телефона... В маркете только QDic делает подобное, но там нет описания к словарям....
Вот набросал на Java заготовку... До андроид- приложения далеко ... так закваска..
Java_RU_text4tts
Наткнулся на очень полезную книгу:
Рыбин С.В. Синтез речи. Учебное пособие 2014.
... в ней упоминается SSML - язык разметки текста для синтезаторов речи....
Что-то у меня словарь склонений чисел работает не на 100% .... причем дело в самом словаре... К примеру <s>Длина 3 мм. </s> -> <s>Длина 3 милли«mt». </s>
В словаре строчка (\d+)\s?(«[a-z\d]+»)?\s?(мм\.?\b|mm\.?\b)=$1$2 «mili»«mt»
делает замену "3 мм" -> "3 «mili»«mt»".
Далее строчка «mili»\s*= милли делает замену "3 «mili»«mt»" -> "3 милли«mt»"...
... а строчки меняющей "«mt»" -> "метра" нет...
Есть строчка «mt:[a-z]1:t2»= метра, но она не для поиска "«mt»"...
Попытка работы со словарями замен для подготовки текста к произношению голосовым движком. Пишется на Java + RegExp. Репозиторий содержит два проекта:
1) Папка Eclipse - проект под Winndows. В нём удобнее отлаживать алгоритмическую часть (алгоритмическая часть и сами словари лежат в папке Android) т.к. не надо каждый раз запускать тяжеловесный эмулятор Android.
Для экспериментов с программой/словарями нужно:
а) Скачать Eclipse IDE (for Java)
б) Скачать JRE- Java-машина
в) Скачать GitHub - yrasik/txt4tts_RU: Попытка работы со словарями замен для подготов… (кнопка "Clone or download")
г) Для случая download - распаковать архив txt4tts_RU-master.zip, скажем на диск C в корень
д) Запустить Eclipse IDE -> File -> Import -> General-> Existing progect into workspace -> Select root directory -> путь к файлу c:\txt4tts_RU-master\Eclipse\.project.
е) Запустить саму программу на выполнение (зелёный кружок с треугольничком). Результаты работы в папке tests ....
2) Папка Android - проект под Android 4.4 + (Android Studio 2.3.3). В этой папке содержатся проектные файлы Android Studio, файлы графического интерфейса и др.
Общая алгоритмическая часть лежит в папке: txt4tts_RU\Android\app\src\main\java\yras\txt4tts_ru\common\
Словари с данного форума (допиливаемые по мере необходимости) лежат в папке txt4tts_RU\Android\app\src\main\assets\dic\
После сборки дистрибутив Android - программы (app-debug.apk) можно найти в папке txt4tts_RU\Android\app\build\outputs\apk\
Этот файл можно закинуть в телефон/планшет и установить в систему...
Aug 29 2017
Не могу избавиться от идем готовить тексты к произношению голосовым движком прямо на Android... т.к. слушаю аудиокниги с телефона... В маркете только QDic делает подобное, но там нет описания к словарям....
Вот набросал на Java заготовку... До андроид- приложения далеко ... так закваска..
Java_RU_text4tts
Наткнулся на очень полезную книгу:
Рыбин С.В. Синтез речи. Учебное пособие 2014.
... в ней упоминается SSML - язык разметки текста для синтезаторов речи....
Что-то у меня словарь склонений чисел работает не на 100% .... причем дело в самом словаре... К примеру <s>Длина 3 мм. </s> -> <s>Длина 3 милли«mt». </s>
В словаре строчка (\d+)\s?(«[a-z\d]+»)?\s?(мм\.?\b|mm\.?\b)=$1$2 «mili»«mt»
делает замену "3 мм" -> "3 «mili»«mt»".
Далее строчка «mili»\s*= милли делает замену "3 «mili»«mt»" -> "3 милли«mt»"...
... а строчки меняющей "«mt»" -> "метра" нет...
Есть строчка «mt:[a-z]1:t2»= метра, но она не для поиска "«mt»"...
Попытка работы со словарями замен для подготовки текста к произношению голосовым движком. Пишется на Java + RegExp. Репозиторий содержит два проекта:
1) Папка Eclipse - проект под Winndows. В нём удобнее отлаживать алгоритмическую часть (алгоритмическая часть и сами словари лежат в папке Android) т.к. не надо каждый раз запускать тяжеловесный эмулятор Android.
Для экспериментов с программой/словарями нужно:
а) Скачать Eclipse IDE (for Java)
б) Скачать JRE- Java-машина
в) Скачать GitHub - yrasik/txt4tts_RU: Попытка работы со словарями замен для подготов… (кнопка "Clone or download")
г) Для случая download - распаковать архив txt4tts_RU-master.zip, скажем на диск C в корень
д) Запустить Eclipse IDE -> File -> Import -> General-> Existing progect into workspace -> Select root directory -> путь к файлу c:\txt4tts_RU-master\Eclipse\.project.
е) Запустить саму программу на выполнение (зелёный кружок с треугольничком). Результаты работы в папке tests ....
2) Папка Android - проект под Android 4.4 + (Android Studio 2.3.3). В этой папке содержатся проектные файлы Android Studio, файлы графического интерфейса и др.
Общая алгоритмическая часть лежит в папке: txt4tts_RU\Android\app\src\main\java\yras\txt4tts_ru\common\
Словари с данного форума (допиливаемые по мере необходимости) лежат в папке txt4tts_RU\Android\app\src\main\assets\dic\
После сборки дистрибутив Android - программы (app-debug.apk) можно найти в папке txt4tts_RU\Android\app\build\outputs\apk\
Этот файл можно закинуть в телефон/планшет и установить в систему...