|
|
Автор | Сообщение | Обсуждение словарей |
---|
asgard Новичок
Сообщений : 23
 | 05.10.12 11:22 |  |
| Пользуюсь Балаболкой с голосовым движком Алёна. При чтении не реагирует на запятые, хотя все остальные знаки препинания работают нормально. Никаким регулировкам не поддаётся. В SpeechPad запятую читает. Возможно проблема в самой балаболке. Подскажите в чём может быть причина? |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
asgard Новичок
Сообщений : 23
Репутация : 1
 | 06.10.12 17:38 |  |
| Спасибо что откликнулись. Балаболка версия 2.3.0515. Но и когда стояли предыдущие версии, запятая также игнорировалась. Текст печатать нет смысла, т.к. паузу не делает на всех запятых и во всех текстах, даже когда балаболка свёрнута и читает из буфера обмена. Словари движка: omograph.dic. Alyona22k.dic. _punctuation.dic. geografic.dic. Словари балаболки: chisla.rex. corector.rex. Аббревиатура-Алёна(Вадим Романько).rex. Математика(Вадим Романько).rex. СИ (Вадим Романько).rex. география.dic. Другими не пользуюсь, с этими читает превосходно. На форуме: Voice Manager - настройка параметров голоса, нашёл несколько советов по настройке голоса перепробовал все. Все параметры меняются и настраиваются, кроме запятой. Включал движок без балаболки, SpeechPad.exe, пауза на запятой делается нормально. Возможно дело в настройках балаболки, но не могу понять где.
|
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 06.10.12 19:52 |  |
| asgard, если SpeechPad читает нормально то дело не в лексиконах можно попробовать сделать следующее:
- отключить все словари в балаболке и прочесть - если произносит нормально тогда подключая по очереди найти проблемный словарь; если не поможет то
- найти файл balabolka.cfg, сделать его копию (на всякий пожарный ) и затем удалить его - это сбросит настройки программы. |
|
|
 | |
asgard Новичок
Сообщений : 23
Репутация : 1
 | 07.10.12 17:31 |  |
| Спасибо за совет. Отключение словарей ничего не дало. Файла balabolka.cfg, в моей балаболке я не нашёл, файлов с расширением.cfg, вообще нет ни одного. |
|
|
 | |
asgard Новичок
Сообщений : 23
Репутация : 1
 | 07.10.12 17:50 |  |
| Ещё у меня есть вопрос: можно ли отключить ё- фикацию. Вместо буквы "е" везде где не надо читает ё. |
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 08.10.12 1:14 |  |
| - asgard пишет:
- Файла balabolka.cfg, в моей балаболке я не нашёл
Этот файл находится в скрытой папке - если виста\7, то в: C:\Users\Имя пользователя\AppData\Roaming\Balabolka
если XP, то в: C:\Documents and Settings\Имя пользователя\Application Data\Roaming\Balabolka
- asgard пишет:
- Вместо буквы "е" везде где не надо читает ё.
Гм... у всех было с точностью до наоборот - вместо "ё" звучало "е" где не надо. Именно поэтому и сделали «Ё»-лексикон и Словарь замены для Ё-фикации текста, которыми Вы кстати не пользуетесь.
|
|
|
 | |
asgard Новичок
Сообщений : 23
Репутация : 1
 | 08.10.12 19:45 |  |
| Спасибо. файл нашёл, запятая появилась, поставил «Ё»-лексикон, стало намного лучше. Пока занимался поиском запятой, возникла проблема со словарём омографов. В тексте довольно часто попадаются омографы: землИ – зЕмли, вОды – водЫ, горЫ – гОры, горА – ГОра (египетский бог). В словаре «omograph.dic» транскрипция слов выглядит так: землИ - # z' $ m l' i1 зЕмли - # z' e1 m l' $ однако даже в словаре при прослушивании слова, оба варианта звучат одинаково как землИ, вОды - # v o1 d I водЫ - # v V d 11 произносит как водЫ. ГОра ни как не хочет считать богом и произносит как горА, может заглавная «Г» влияет. В тексте вместо горЫ читает гОры. После слова горы ставлю запятую, читает как горЫ. Чтобы хоть как-то добиться сносного произношения приходится в слово добавлять лишнюю ударную гласную: зЕемли, вОоды, ГОора. Это не самый лучший выход. Пока проблемы с этими тремя словами, остальное вроде читает хорошо.
|
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 08.10.12 22:28 |  |
| - asgard пишет:
- словаре «omograph.dic» транскрипция слов выглядит так:
землИ - # z' $ m l' i1 зЕмли - # z' e1 m l' $ Минуточку, в словаре «omograph.dic» нет транскрипций - в нём правила для замены текста! Немного повыше Вашего поста, я объяснял, что есть лексиконы для движка и словари для программ. Таким образом "Лексикон для словаря замен[omograph_lex]" нужно подключить к Lexicon Manager'у, а Словарь замены ударений [omograph] скопировать сюда: C:\Users\Имя пользователя\Documents\Balabolka и подключить уже в самой программе на панели словарей. Хочу ещё раз подчеркнуть; omograph_lex.dic и omograph.dic концептуально разные файлы, будьте предельно внимательны! И читайте здесь Множество вопросов просто исчезнет, если почитать. |
|
|
 | |
asgard Новичок
Сообщений : 23
Репутация : 1
 | 11.10.12 15:38 |  |
| Спасибо конечно за подробную консультацию. Обновил и переустановил все словари, строго по инструкции, добавил которых не было, однако проблему это не решило. |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
Dekabrus Участник
Сообщений : 61
Репутация : 3
 | 11.10.12 19:07 |  |
| Забавно- печальный факт.
Слово "совсЕм" зафиксировал в Лексиконе. Лексикон читает правильно.
Балаболка в тексте читает "совсЁм".
В corector rex зафиксировал: совсем=совсЕм.
Балаболка по прежнему читает "совсём".
Что можно предпринять? |
|
|
 | |
asgard Новичок
Сообщений : 23
Репутация : 1
 | 11.10.12 21:27 |  |
| слова "гора" «Гора» в лексикон заносил сам, кода возникла необходимость.
зЕмли #zz' e1 m l' $ Исправил в словаре, звучать стало чётче но не всё. Многие кругообороты Земли совершились – читает как землИ вдали от ЗемлИ находились - читает как зЕмли. вдали от Земли, находились - читает как землИ Чтобы золото с Земли оттуда доставлять - читает как зЕмли.
он хотел на гребне горЫ построить жилище. - читает как гОры. он хотел на гребне горЫ, построить жилище. - читает как горЫ. К склону горЫ подался. - читает как гОры. которым горы разрушали, . - читает как гОры. Заметил зависимость от запятой.
Ещё иногда при чтении текстов (особенно из интернета) слышатся посторонние звуки, которых нет в тексте: «дыщ», «ва» Пробовал стирать и набирать текст заново, но звук оставался. Пример: сорок шаров они только… – читает как: сорок ва шаров они только…
|
|
|
 | |
asgard Новичок
Сообщений : 23
Репутация : 1
 | 12.10.12 10:39 |  |
| чтобы не быть голословным, сделал аудио файл. как его переслать, если надо. |
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 12.10.12 15:13 |  |
| Dekabrus, нужен пример текста где произносит "совсЁм"
- Dekabrus пишет:
- В corector rex зафиксировал: совсем=совсЕм.
лучше создавайте отдельные пользовательские словари потому что если словарь обновится то вам нужно будет вручную переносить все свои правки. asgard, в лексиконе есть всего две формы омографа земли - зЕмли и землИ, соответственно в тексте, для указания ударения в этом слове, допускаются только эти две формы:
- Цитата :
- Многие кругообороты землИ совершились
вдали от землИ находились вдали от землИ, находились Чтобы золото с землИ оттуда доставлять ...
- asgard пишет:
- Заметил зависимость от запятой
да, но лучше заменить транскрипцию - Код:
горЫ #g V r 12
- asgard пишет:
- Ещё иногда при чтении текстов (особенно из интернета)
да, нужно предварительно обработать текст словарем (в данном случае корректором) для озвучивания любого текста - из интернета, субтитров к фильму, книг и т.п. сперва нужно разметить текст (расставить ударения в омографах и исправить корректором ошибки произношения движка). затем текст можно озвучивать в любой программе.
p.s. транскрипции слов зЕмли и горЫ исправим а омограф гОра - горА добавим, спасибо |
|
|
 | |
asgard Новичок
Сообщений : 23
Репутация : 1
 | 13.10.12 9:27 |  |
| Словарь замен corector.rex, установлен и включен. А вот про разметку и исправление корректором ошибок произношения движка можно, немного по подробнее. Может я что-то не так делаю.
|
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
Baton Новичок
Сообщений : 14
Репутация : 0
 | 19.10.12 12:47 |  |
| Друзья, подскажите, как (чем) можно перевести системный лексикон .dic в текстовый формат и обратно? На предмет обработки напильником текстовым редактором? |
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 19.10.12 20:04 |  |
| Это системный лексикон, к чему его трогать! В иннете и так гуляет т.н. "литературный" лЁксикончик никуда не годный.  |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
asgard Новичок
Сообщений : 23
Репутация : 1
 | 22.10.12 14:57 |  |
| Такая-же тема. Раньше балаболка не делала пауз на запятой. По совету установил кучу словарей, появилась куча других ошибок. Дайте ссылочку где можно почитать как формируются правила в словарях:corector.ini, СИ (Вадим Романько).rex Аббревиатура-Алёна(Вадим Романько).rex и т.д. Может удастся разобраться, чтобы не задавать потом глупых вопросов. |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 26.10.12 19:31 |  |
| - asgard пишет:
- Дайте ссылочку где можно почитать как формируются правила в словарях:corector.ini, СИ (Вадим Романько).rex
Аббревиатура-Алёна(Вадим Романько).rex и т.д. в этих словарях используются правила на основе регулярных выражений
- Цитата :
- словарь замен ini использующий регулярные выражения работающий только по стандарту VBScript;
- словарь замен ini использующий регулярные выражения работающий только по стандарту PCRE;
- словарь замен ini использующий регулярные выражения работающий одинаково по стандарту VBScript и PCRE;
В последних версиях программ «балаболка» и «демагог» формат заменён на формат . Словари формата это те же словари использующие регулярные выражения работающие только по стандарту PCRE. Словари формата поддерживаются только более ранними версиями программ где есть переключение старого формата словарей.
|
|
|
 | |
asgard Новичок
Сообщений : 23
Репутация : 1
 | 27.10.12 18:20 |  |
| Мне это не сильно помогло. |
|
|
 | |
Dekabrus Участник
Сообщений : 61
Репутация : 3
 | 01.11.12 19:05 |  |
| Хочу поделиться опытом по борьбе с омографами.
Как без особых усилий заставить Алёнку различать, к примеру, "все" и "всё".
В Лексиконе ставлю транскрипцию.
все#f s' 91 ( = всё)
мсе#f s' e1 ( = все)
В балаболке ставлю соответственно
все=всЁ мсе=всЕ
Затем!!!
В тексте книги (документе " World") нахожу слово "все" и заменяю его на "мсе" там, где оно должно звучать как "все". ( их намного меньше, чем " всё").
На обработку текстового объёма, эквивалентного пятистам мегабайтам формата мр3, уходит минут 5.
И всё. 
Алёнка послушно читает и "все" и "всё". |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 02.11.12 5:43 |  |
| - Dekabrus пишет:
- В Лексиконе ставлю транскрипцию.
все#f s' 91 ( = всё) мсе#f s' e1 ( = все) В балаболке ставлю соответственно все=всЁ мсе=всЕ [...] В тексте книги (документе " World") нахожу слово "все" и заменяю его на "мсе" там, где оно должно звучать как "все". ( их намного меньше, чем " всё"). Это излишние телодвижения для сугреву на морозе! Если есть время, можно сделать намного проще, да и точность будет абсолютная; в поле Заменить что пишем все в поле Заменить чем пишем всё Нажимаем "Найти далее", смотрим в контекст и играемся с мышкой. |
|
|
 | |
Dekabrus Участник
Сообщений : 61
Репутация : 3
 | 02.11.12 13:39 |  |
| - evilone_ пишет:
- Dekabrus, а почему не использовать новый экспериментальный словарик
1..он для Демагога, а у меня Балаболка. 2. мой способ не только для "все\всЁ , но и для всех неисправимых глюков, типа моего " на хОду" и " КанарИса".
|
|
|
 | |
Dekabrus Участник
Сообщений : 61
Репутация : 3
 | 02.11.12 13:52 |  |
| - evmir_troll-hunter пишет:
- в поле Заменить что пишем все в поле Заменить чем пишем всё
для исправления глюка всё-равно придётся заменять буквы и вносить соответствующие транскрипции.
мой глюк "на хОду" я заменяю на "ма ходу" и Алёнка читает правильно = "на ходУ". ( секундное дело) |
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 02.11.12 15:01 |  |
| - Dekabrus пишет:
- но и для всех неисправимых глюков,
Глюки исправляются если внимательно изучить матчасть.
- Dekabrus пишет:
- мой глюк "на хОду" я заменяю на "ма ходу" и Алёнка читает правильно = "на ходУ". ( секундное дело)
Не вводите в заблуждение новичков - это отнюдь не секундное дело! Вы совершенно не поняли принцип работы словарей, поэтому усложняете простые вещи. |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 02.11.12 19:00 |  |
| "на ходу" меняет сам словарь omograph.dic, если все правильно подключить... но видимо вы не ищете легких путей? зачем такие сложности с поиском и заменой? для этого в балаболке есть функция "поиск омографов".- Dekabrus пишет:
- он для Демагога, а у меня Балаболка
установленный (разархивированный - его не нужно инсталлировать) демагог занимает чуть больше 6Мб, можно было уже давно и попробовать |
|
|
 | |
Dekabrus Участник
Сообщений : 61
Репутация : 3
 | 02.11.12 20:03 |  |
| - evmir_troll-hunter пишет:
- Глюки исправляются если внимательно изучить матчасть.
Вы можете мне просто подсказать, как исправить этот конкретный глюк?
"на хОду".
========= в Лексиконе и в лексиконе омографов прописано на ходу#n @ x V d u1
в балаболке прописано на ходу= на ходУ
пробовал на ходу=находУ. Не помогает.
И, что просто бесит, = в Лексиконе и в Балаболке читает правильно ( на ходУ) , а в тексте = на хОду.
|
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 02.11.12 20:19 |  |
| - Dekabrus пишет:
- в Лексиконе и в лексиконе омографов прописано
на ходу#n @ x V d u1 Исправьте - в лексиконе омографов уберите пробел между "на" и "ходу": находУ #n @ x V d u1 ADVERB А в словаре замен для Балаболки напишите: на ходу=находУ И всё. |
|
|
 | |
Dekabrus Участник
Сообщений : 61
Репутация : 3
 | |
 | |
Dekabrus Участник
Сообщений : 61
Репутация : 3
 | 02.11.12 21:09 |  |
| - Dekabrus пишет:
- Хочу поделиться опытом по борьбе с омографами.
Правильно говорят, что нужно делиться.
Если бы не поделился опытом, то так и менял бы "на ходу" " ма ходу"..... |
|
|
 | |
Dekabrus Участник
Сообщений : 61
Репутация : 3
 | 08.11.12 9:45 |  |
| Хочу поделиться опытом-2.
- Цитата :
- " Но зайти туда, особенно в такую погоду, все равно хорошо."
В этой фразе Аленка читала "погодУ" Оказалось, что на ударение влияет запятая, после слова " погоду".
Пропечатал в Балаболке и в Лексиконе омографов: погоду, = погОду,
и "погода" наладилась. |
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 08.11.12 12:51 |  |
| - Dekabrus пишет:
- погоду, = погОду,
Нет, лучше исправить транскрипцию в лексиконе трудночитаемых слов - и она была исправлена(!) на: погоду #p V g o2 d U NOUN Почему у Вас произносит "погодУ", не ясно. Возможно неправильный порядок подключения лексов. Приоритет должен быть такой:- yo_defis.dic
- YO_lex.dic
- omograph.dic [Лексикон для словаря замен {архив omograph_lex.7z}]
- Alyona22k.dic
- _punctuation.dic
- Geografic.dic
Если не поможет, поэкспериментируйте с транскрипцией; попробуйте #p V g o d U или #p @ g o2 d U или #p @ g o d U
|
|
|
 | |
Dekabrus Участник
Сообщений : 61
Репутация : 3
 | |
 | |
asgard Новичок
Сообщений : 23
Репутация : 1
 | 27.12.12 14:51 |  |
| В технических текстах часто встречаются сокращения: 20 °С, 20 °К, 20 °F. Значок градуса балаб. читает, а вот Цельсия, Кельвина, Фаренгейта нет. Подскажите как это можно исправить.
|
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
asgard Новичок
Сообщений : 23
Репутация : 1
 | 29.12.12 13:17 |  |
| Спасибо. Занёс их в словарь"СИ (Вадим Романько).rex", но совместно со словарём"chisla.rex", работать отказывается?
|
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
asgard Новичок
Сообщений : 23
Репутация : 1
 | 29.12.12 18:09 |  |
| но словари в балаболке выставляются автоматически, по алфавиту. |
|
|
 | |
flegont V.I.P.
Сообщений : 355
Репутация : 475
 | |
 | |
vadimpetru Наблюдатель
Сообщений : 1
Репутация : 0
 | 05.01.13 20:01 |  |
| Установил Windows 8 pro(лицензия). Не работает "Балаболка" в режиме Sapi 5 при использовании голосового движка Alyona "Acapela Infovox Desktop v.2.220 Engine" Пишет: Access violation at address 066E4F0C in module 'AcaTtsSapi5.dll'. Read of address 00000000. |
|
|
 | |
Basil Наблюдатель
Сообщений : 1
Репутация : 0
 | 14.01.13 4:21 |  |
| Доброго времени суток!
Помогите разобраться с проблемкой (я извиняюсь если этот вопрос уже был). Скачиваю словари и в большинстве из них непонятная кодировка..т.е. непонятные символы разного рода. Пробовал подобрать кодировку через различные кодировщики- банан!! Как решить эту проблему? |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | 10.02.13 4:35 |  |
| Посмотрел на словари - они, в общем, не маленькие. Насколько они тормозят (или нет) на Windows CE и Mobile и на Андроиде? Или здесь только desktop версия обсуждается? Если так - извините, что лезу со свиным рылом в калашный ряд... |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 10.02.13 12:03 |  |
| Скорее всего мобильными версиями движков здесь мало кто пользуется и имеет результаты . Но за ваши труд спасибо. |
|
|
 | |
Dave_Scream Интересующийся
Сообщений : 5
Репутация : 2
 | 03.05.13 23:36 |  |
| ребята, поскольку работа со словарями долгая нудная и кропотливая, её нужно делать сообща.
Вы не думали использовать специально созданные для этого инструменты? например сервис GIT ? в нём каждый участник может обновлять словарь, внося свои изменения и комментарии что он изменил, обновление автоматически синхронизируется с остальными участниками. Так любой сможет внести вклад. Есть система контроля версий, то есть в любой момент можно достать предыдущую версию или даже разные ветви развития. Проект используется программистами при разработке проектов. --- второй вариант - можно сделать общую папку в Яндекс.Диске или Dropbox'е и в неё залить словари. Получается любой желающий сможет что-то добавить в последнюю актуальную версию словаря. Но GIT лучше, поскольку можно по каждому внесению изменений оставлять комментарий о проделанной работе. |
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 04.05.13 2:16 |  |
| - Dave_Scream пишет:
- работа со словарями долгая нудная и кропотливая, её нужно делать сообща.
Такое уже было, уверен в этом деле нужен главный редактор. Админ. поручил мне Лексикон трудночитаемых слов, «Ё»-лексикон и Лексикон географических названий. Все предложения\транскрипции пишите мне в ЛС.
- Dave_Scream пишет:
- Но GIT лучше
Обратитесь в администрацию форума. |
|
|
 | |
|
Обсуждение словарей |
---|