|
|
Автор | Сообщение | Балаболка |
---|
balabolka V.I.P.
Сообщений : 1212
 | 27.03.10 13:53 |  |
| Оба метода ("стандартный" и "быстрый") должны одинаково применять правила, именно на это были направлены усилия создателя "быстрого" метода Венедикта Ли (так написано на его сайте). Я согласен с его точкой зрения - пользователи должны иметь возможность применять одни и те же словари в разных программах ("Говорилка", "ABoo", "Демагог", "Балаболка"), поэтому между "стандартным" и "быстрым" методами не должно быть различий. Я добавил в свою программу поддержку обоих методов лишь ВРЕМЕННО, рассчитывая в будущем оставить только "быстрый" метод, когда он будет полностью отлажен; просто руки не доходят принять окончательное решение (да и нет необходимости принимать решение сейчас).
То, что lev55 использовал в своих словарях проблему/ошибку "быстрого" метода в реализации множественных замен, исправленную в последних версиях "Бабалоки" (исправленную, кстати, по просьбе кого-то из пользователей) - это был неосмотрительный шаг с его стороны. То, что придется переделать какие-то из словарей, - прискорбно, сочувствую, но не надо устраивать из этого трагедию. Например, мой основной программный продукт "Cross+A" содержит 100000 слов с описаниями в русской версии и 160000 слов (60000 - с описаниями) в английской версии; мне понадобились годы, чтобы вручную обработать такие объемы текста, - но я же не умер; знаю людей, которые обработали десятки, сотни списков слов на самых разных языках.
Также, я так и не получил ответа на свой вопрос, какие же именно правила перестали работать в "Балаболке" - кроме правила с шаблоном "*олет". В случае с этим шаблоном полностью солидарен с Lexus - такие короткие правила использовать нельзя, это неправильно. Совершенно точно не стану менять программу для поддержки такого подхода (когда умышленно "портим" ударения в десятках слов одним коротким правилом, а затем другими правилами исправляем ошибочные слова).
Если lev55 хочет написать свою собственную программу для чтения вслух - что ж, пожелаем ему удачи. Но плодить словари, несовместимые друг с другом, которые нельзя использовать во всех существующих программах, - не считаю это правильным; а именно этого хочет lev55. |
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | |
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 29.03.10 8:43 |  |
| Пожелания к "Злобный троль" или как Вы там себя "ДобрыЙ ФеЙ" ШЛИ БЫ ВЫ ЛЕСОМ и перестали бы поминать своим поганым рылом таких людей как Ларин и Автор, которых вы и мизинца не достойны. И будьте принципиальны до конца. Перестаньте пользоваться "Балаболкой". На том и достачно. PS. Почуствовали блин запах и давай лезть из щелей. Пожелание к Автору: не обращайте внимания. Так устроен мир, что всегда найдется злобная мразь, которой не дает покоя чужой успех и жизненные ориентиры направленные не на тупую погоню за баблом. Успехов Вам в жизни и творчестве. А мы всегда будем с Вами. |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 29.03.10 9:13 |  |
| И еще. Я думаю, что если Вас ставят в один ряд с такими личностями, как Ларин, то Вы не зря живете и занимаетесь достойным Делом. Могу посоветовать воспринимать это как комплимент. |
|
|
 | |
flint2 Посетитель
Сообщений : 43
Репутация : 11
 | |
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 29.03.10 12:58 |  |
| ДобрыЙ ФеЙ=flint2 ?
ДобрыЙ ФеЙ Наблюдатель Сообщений: 1 flint2 Наблюдатель Сообщений: 3
Злобнный ФРей Я Вас похоже переоценил. Вы та субстанция, которою называют слизь. Вот lev55 был Личность. И я его за это уважаю. |
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | |
 | |
Sekuka Посетитель
Сообщений : 30
Репутация : 8
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 04.04.10 16:29 |  |
| спасибо за обновления но почему-то не работает у меня "Сохранять заглавную букву при использовании правил" Вот такие три словаря:
- Спойлер:
-
и вот такой кусочек текста до:
- Спойлер:
-
Крозье со своим дрУгом и тогдашним начальником экспедиции Джеймсом Россом открыли именно такой новый континент - Антарктику - без малого пять лет назад. Они назвали море, залив и материк именем Росса. Они назвали горы именами своих друзей и покровителей. Они нарекли два вулкана, видневшихся на горизонте, в честь своих кораблей - вот этих самых кораблей, – дав дымящимся горам названия Террор и Эребус. Крозье удивило, что они не назвали какой-нибудь значительный географический объект в честь корабельного кота. и после:
- Спойлер:
-
Крозье со своим др^угом и тогдашним начальником экспедиции Джеймсом Россом открыли именно такой новый континент - антарктику - без малого пять лет назад. они назвали море, залив и материк именем Росса. они назвали горы именами своих друзей и покровителей. они нарекли два вулкана, видневшихся на горизонте, в честь своих кораблей - вот этих самых кораблей, – дав дымящимся горам названия Террор и эребус. Крозье удивило, что они не назвали какой-нибудь значительный географический объект в честь корабельного кота. или оно не так работает? |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 04.04.10 19:26 |  |
| balabolka ага теперь ясно, спасибо- Цитата :
- Новая опция нужна для того, чтобы голоса могли распознавать начало предложения и менять интонацию речи соответствующим образом. Если предложение начинается с маленькой буквы, русские голоса не "видят" такие предложения.
это наверно актуально для ольги, потому что для аленки заглавные буквы в начале предложения на интонацию никак не влияют и для сравнения два текста (один как обычно а другой такой же но у которого все строчные буквы) получаются одинаковыми на интонацию у нее влияют только знаки препинания и пробелы между ними.
и еще вспомнилось, на счет форматирования текста. иногда в тексте перед запятыми, скобками, кавычками и т.п. попадаются по одному два и более пробелов и при чтении они произносятся как "запятая" "точка" и т.д. т.е. словами мы сейчас для аленки сделали правила которые частично корректируют все это безобразие но иногда бывают "проскоки" два и более пробела, новая строка и т.п. перед знаками пунктуации пробела не должно быть а после них всего один, а для скобок и кавычек наоборот. может есть смысл добавить возможность автоматической правки пробелов вокруг знаков препинания при форматировании текста? |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 04.04.10 20:18 |  |
| - Цитата :
- перед знаками пунктуации пробела не должно быть
А вот для Катерины, наоборот.
- Цитата :
- может есть смысл добавить возможность автоматической правки пробелов вокруг знаков препинания при форматировании текста?
А словари здесь не справляются? Просто и тут каждый движок требует индивидуального подхода. Можно ведь внести несколько похожих правил и они будут последовательно применены к тексту, это должно помочь. |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 04.04.10 20:57 |  |
| - Цитата :
- А вот для Катерины, наоборот.
а она не произносит знаки словами если перед ними стоит пробел?
- Цитата :
- А словари здесь не справляются?
в 99% словари справляются со всем, если знать как это нужно сделать, но для многих это темный лес |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 04.04.10 21:14 |  |
| - Цитата :
- а она не произносит знаки словами если перед ними стоит пробел?
Нет. У неё там своих косяков хватает. Это всего лишь костыль. А Ольгу можно настроить изнутри.
- Цитата :
- в 99% словари справляются со всем, если знать как это нужно сделать, но для многих это темный лес
Это и печалит больше всего. Лично сам прошу добавить в балаболку, только то, чего не могу изменить словарями. А словарями сейчас она может делать практически все. Состояние русскоязычных движков пока такое, что вряд ли ими стоит заниматься, если не готов освоить такую малость. На самом деле, чтобы быть в теме нужно еще владеть хотя бы одним языком программирования. |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 05.04.10 11:01 |  |
| Посмотрел как работает новая опция "Сохранять заглавную букву при использовании правил" для Ольги. Прогресс налицо. Подобные совпадения с первым словом в предложении хотя и не очень часто, но всеже несколько портили интонацию в тексте (может 3-5%).
- Цитата :
- В Вашем примере используются правила, где учитывается регистр букв:
$*0*=^о То есть, составитель словаря умышленно меняет большую букву на маленькую букву; здесь новая опция не участвует, правила с "$" новой опцией не обрабатываются. То есть, еще раз обращаю внимание пользователей, что настройка "Сохранять заглавную букву при использовании правил" применяется лишь к тем правилам, где НЕ УЧИТЫВАЕТСЯ регистр букв (нет символа "$" в начале правила).
Такой подход, когда учитывается регистр букв во второй части правила вызывает сомнения по следующим причинам: -для Алены с текущими словарями ее использовать не будут -при составлении словарей я, и как мне думется и большинство никогда особо не задумываются о регистре букв во второй части правил. Посмотрел словари, там такое случайное разнообразие в регистре букв второй части правила... Оно и понятно для запуска правила важен регистр букв в первой части правила.
Может быть стоит игнорировать значок $ и делать обработку по общей схеме? |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 06.04.10 15:09 |  |
| Восстановление заглавной буквы не срабатывает в правилах типа: элвис=^элвис и елвис=элвис текст: Элвис дома после обработки: ^элвис дома
По-поводу отслеживания регистра букв второй части регистрзависимого правила, лично я склоняюсь к мысли, что этого делать не нужно. 1. Это усложняет проверку правильности словарей. Ведь в таком случае правило $Вода=в^ода неправильно и должно быть только в виде: $Вода=В^ода 2. Пока, на мой взгляд, не существует ситуаций, которые может помочь решить отслеживание регистра букв второй части регистрзависимого правила |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 06.04.10 21:22 |  |
| Да, на домашнем ПК и у меня с Элвисом порядок. Отличия в операционных системах XP против W2k. В обоих случаях всего несколько правил в словарях, т.е. ничего лишнего. Завтра попробую еще.
- Цитата :
- Например, регистр важен в таком правиле:
$Лев Толстой=Лев Толст^ой
Здесь вопрос уже почти философский. Возможны несколько вариантов: 1. Имеем неправильное правило и включенную опцию "Сохранять заглавную букву при использовании правил" при отказе от отслеживания регистра букв второй части регистрзависимого правила $Лев Толстой=лев толст^ой на выходе получим $Лев Толстой=Лев Толст^ой
2. Даже если (да простят меня учителя русского языка!) $Лев Толстой=Лев толст^ой Мы получим текст, который будет правильно прочтен движком, поскольку правило все равно будет применено. И в дальнейшем ему вряд ли суждено быть чем либо испорченным поскольку в нем уже есть инородный символ "^"
Еще раз сделаю акцент на том, что мы не дискутируем об отмене в программе правил типа $*0*=^о и им подобных. Мы всего лишь обсуждаем варианты восстановления заглавной буквы при включенной опции "Сохранять заглавную букву при использовании правил"
И я продолжаю придерживаться точки зрения, что регистрзависимые правила должны также подвергаться восстановлению. Хотя бы по той причине что таких правил могут быть тысячи, и ошибки всегда будут. Повторюсь, пока не существует ситуаций, которые может помочь решить отслеживание регистра букв второй части регистрзависимого правила при восстановлении заглавной буквы, зачем усложнять себе жизнь дополнительными ограничениями. |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 07.04.10 9:54 |  |
| По поводу элвисов, все работает нормально. Скорее всего не сохранил опцию восстановления в настройках. Приношу извинения. |
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 07.04.10 20:05 |  |
| Столкнулся проблемой; Балаболка не может открыть и обработать очень большой текст. Я загрузил словарь «Полная акцентуированная парадигма по А. А. Зализняку» в текстовом формате, обработал его Text parser (расположив слова в столбик), и попытался открыть в Балаболке, чтобы проверить на вычитку. Ведь в Lexicon manager такую махину (33.5Мб) грузить непрактично, так как большинство слов Алена читает верно. Но случаются ошибки – их я и хотел выловить. И Балаболка зависла! Причем на долго, у меня не хватило терпения – пришлось программу жестко отключать. Затем надумал Балаболкой данный текст разбить на части – снова зависла. На этот раз я честно ждал 7 часов, но не отпустило. К слову, Word тоже еле текст открыл, покряхтывая и подвисая его сохранил, показал провда количество слов 2 674 345. А вот Блокнот, казалось бы такая мелочь, работает с текстом довольно быстро (зависая на минуту, две). Поэтому я открываю словарь в Блокноте, копирую часть текста в буфер обмена ок. 4-5 тыс. слов) и вставляю в Балаболку. В связи с этим вопрос-предложение. нельзя ли сделать Балаболку более мощной в плане огромнейших объемов текста? Было бы намного удобней работать в одном приложении, а не в нескольких. |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 08.04.10 1:33 |  |
| Бомба!!!! файл открылся за 35сек. Я все отключил по Вашему совету. Спасибо за подсказку Правда Алена стала заикаться, но претензий к Балаболке не имею. Скорее всего движок Acapela тормозит на огромных файлах |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | |
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 08.04.10 14:45 |  |
| Хорошо бы, оставить пользователю возможность подобрать под свои компьютер размер текста при котором начнутся отключения функции, где-нибудь в настройках. |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 11.04.10 16:36 |  |
| - evilone_ пишет:
- все отлично работает, только не убирает пробелы между кавычками, наверно и не должно?
Кавычки не обрабатываются. Моя программа - интернациональная, а в разных языках кавычки ставятся по-разному (и даже совершенно различные символы используются).
Хотя, в русской версии программы Cross+A такая обработка была реализована. Возможно, в будущем еще вернусь к этому вопросу.
- evilone_ пишет:
- не хватает разве что если пробела нет чтобы оно его и поставило еще, ну хотя бы для
- Код:
{[(,.!?;:
Подумаю над этим. Опять-таки, здесь не все однозначно для разных языков.
- evilone_ пишет:
- если при процессе преобразования текста словарями "показать измененный текст" свернуть в значек рядом с часами то после того как текст преобразуется окно прогресса не исчезает, а при следующем преобразовании выскакиевает сообщение про ошибку какого-то модального окна или что-то такое
Спасибо за сообщение, постараюсь исправить. (После завершения процесса программа будет автоматически восстанавливаться из трея, иначе окно измененного текста не показать.)
- evilone_ пишет:
- при редактировании словаря для ручного поиска омографов (hmg) нет ли возможности добавить для закладки "искать в тексте" такую же настройку как при поиске имен - не искать слово из словарей
Ох, это сложно.
Вообще, мной было задумано, что словари и омографы - это разные вещи; не хотелось бы это менять - могут возникнуть проблемы. Словосочетания с использованием омографов надо было добавлять в омографы, а не в словари. |
|
|
 | |
maliwkamary Наблюдатель
Сообщений : 1
Репутация : 0
 | 13.04.10 17:47 |  |
| У меня балаболка все ексты читает на англиском, как мне её настроить что бы она читала и на руском и на украинском??? |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
Sekuka Посетитель
Сообщений : 30
Репутация : 8
 | 17.04.10 22:37 |  |
| В последней версии появились улучшения при чтении буфера обмена. В связи с чем вопрос к автору. программа читает буфер используя при этом подключенные к балаболке словари, или нет? |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
Sekuka Посетитель
Сообщений : 30
Репутация : 8
 | 18.04.10 0:13 |  |
| - balabolka пишет:
Да, при чтении содержимого буфера обмена используются словари. Ну вот и сбылась давняя мечта озвучивать в Опере сообщения через балаболку. Спасибо. |
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 18.04.10 5:48 |  |
| Заметил дефект; в моем словаре есть замены *ие воды=ие вОды *ые воды=ые вОды Так вот при Стандартном методе обработки текста всегда заменяется на «тихие водЫ» или «холодные водЫ», неважно какие там прилагательные, а при Быстром методе все отлично. Может это только у меня, проверьте. Если происходит такая же ошибка, то есть вопрос-предложение: а не пора ли отказаться от Стандартного метода? Что думаете по этому поводу? |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 18.04.10 13:28 |  |
| При включенной опции "Копировать в буфер" для чтения по горячим клавишам буфера обмена. Не всегда подхватывается текущий текст. Бывает читается предыдущий фрагмент.Бывает вообще не читает. Предложения: -Производить принудительную очистку буфера перед чтением. -Если посылка в буфер через sendkeys, сделать настраиваемый таймаут рядом с галочкой"Копировать в буфер" -ОБЯЗАТЕЛЬНО прекращать чтение при повторном нажатии горячих клавиш, с началом чтения текущего выделенного фрагмента.
Все это, на мой взгляд, сделает опцию максимально полезной. |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 18.04.10 15:04 |  |
| balabolka
- Цитата :
- Именно поэтому в программе нет опции чтения текста в "чужих" окнах - нет стопроцентной уверенности, что удастся получить этот самый текст
Я так понял, что именно для чужих окон опция. В балаболке и так все хорошо читается. Пробовал в читать в Опере. Поэтому кнопка 'стоп' была далековато. Да и нужно ли ее жать, если следует команда прочесть новый фрагмент? А может нужно просто повторить пропущенное. ПК самый слабенький Atom Z520. От размера текста наверное зависит. Сбои были на больших кусках. А рекомендации писал исходя из немалого опыта использования скриптов для аналогичных целей. |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
flint2 Посетитель
Сообщений : 43
Репутация : 11
 | 19.04.10 14:50 |  |
| balabolka
- Цитата :
- Да, действительно, именно так и надо сделать при чтении буфера обмена
Суета - суе' ^'т. Всегда в рот будут смотреть. А ещё надо рюшечьчки с валанчиками пусить, только чтоб блестело. Дали бы свои словари Вы или (Lexus), тои наверное вопросы были бы сяты. Для примера, чтоб знать как. Lexus (не удвлюсь, что минус посавите), а толку всё равно нет от Вас! Может предложить... "нет сейчас в однобортном никто не воюет". balabolka Разберись, багов полно(могу список дать), а ты украшательством занимаешься. Если у тебя есть концепция, то не надо русским пользователям мозги канифолить. Нельзя нашим и вашим, надеюсь понятно. Если есть желание помочь, то надо лицом повернуться. Я за Lev55 следил почти как зарегистрировался. Видно, что он пытался понять всю кухню. Он старыми версиями пользуется и чего то поправил (множественные замены и т.д.). Теперь даже павелительные наклонения пашут (я в кухне не рублю, появился только ещё одн словарь бинарный с частями речи). Ошибок практически нет, только числа в слова не всегда правильно переводятся. Могу переслать всё. |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 19.04.10 15:19 |  |
| 2flint2 Странные какие-то претензии. Минусы ставить многие умеют. Может кто-то и намеренно Вас на больной мозоль жмет. Хотя все Ваши записи как-то не по-существу. ИМХО. |
|
|
 | |
flint2 Посетитель
Сообщений : 43
Репутация : 11
 | 19.04.10 15:25 |  |
| Lexus Тады - Ой! |
|
|
 | |
flint2 Посетитель
Сообщений : 43
Репутация : 11
 | 19.04.10 15:51 |  |
| Lexus А можно посмотреть, как у тебя сделано? В смыяле не тольно словари ну и вся кухня с ini и т.д. и *.lex. |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 19.04.10 16:01 |  |
| 2lint2 Ничего оригинального. Прогоните ваши словари через поиск пар правил. Минимизируйете сомнительные слова со звездочками, и у вас будет очень похожие словари. Автор всех словарей один - Зализняк. |
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 19.04.10 16:13 |  |
| - flint2 пишет:
- balabolka
Разберись, багов полно(могу список дать) Не нужно быть голословным! Если есть список багов, предоставте |
|
|
 | |
flint2 Посетитель
Сообщений : 43
Репутация : 11
 | 19.04.10 16:14 |  |
| Ну всётаки, дадите комплект??? Я сравнивать не буду! Мне нужен комплект которым можно пользоваться! Я не совсем врубаюсь о чём все спорили, но раз спорили, значит не просто. Даже не безвозмездно)). Думаю это излишне, но вётаки... |
|
|
 | |
|
Балаболка |
---|