|
|
Автор | Сообщение | Обсуждение словарей |
---|
SergeiSP Новичок
Сообщений : 19
 | 01.03.09 16:23 |  |
| Хм. Как я понимаю, на данный момент под Ольгу нет качественных словарей? То что для Диалго, так в Ольге ошибок еще больше становиться, чем без этих словарей. В общем, либо я не догоняю чего-то, но есть хоть один словарь нормальный, или нет? |
|
|
 | |
Stroodder V.I.P.
Сообщений : 98
Репутация : 7
 | 01.03.09 17:35 |  |
| SergeiSP Если найдете для Дигало нормальный, то и для Ольги можно сделать. |
|
|
 | |
rquester V.I.P.
Сообщений : 137
Репутация : 16
 | 02.03.09 1:54 |  |
| SergeiSP Попробуйте "Книгодел" (в режиме Export). Он ставит ударения гораздо лучше всех словарей. Есть и возможность использовать для Ольги (три режима простановки ударений на выбор, выбираются в Настройках)... |
|
|
 | |
Stroodder V.I.P.
Сообщений : 98
Репутация : 7
 | 02.03.09 6:04 |  |
| - Цитата :
- Он ставит ударения гораздо лучше всех словарей.
 |
|
|
 | |
rquester V.I.P.
Сообщений : 137
Репутация : 16
 | 02.03.09 12:37 |  |
| - Цитата :
- Он ставит ударения гораздо лучше всех словарей.
Именно так. Словари dic дают гораздо худший результат... Более того, увеличение размеров словарей уже мало что даст - улучшение распознавания ударения одних фраз будет сопровождаться ухудшением других... В Книгоделе используется гораздо более корректный алгоритм, который даёт сбои очень редко, причем, в основном, на фразах, которые и человек с трудом понимает. |
|
|
 | |
Stroodder V.I.P.
Сообщений : 98
Репутация : 7
 | 02.03.09 13:03 |  |
| - Цитата :
- ...очень редко...
К сожалению ни одного факта или внятного аргумента Вы так и не смогли привести в подтверждение ни на этом, ни на других форумах, давайте не будем хотя бы в этой теме саморекламой заниматься и выдавать желаемое за действительное.
З.Ы. Если пользователь использует для обработки хлам, а не вычищенные словари, то и результат у него будет соответствующий. |
|
|
 | |
rquester V.I.P.
Сообщений : 137
Репутация : 16
 | 02.03.09 17:34 |  |
| - Цитата :
К сожалению ни одного факта или внятного аргумента Вы так и не смогли привести в подтверждение ни на этом, ни на других форумах
Программа доступна для скачивания. Вполне можно проверить... Если хотите - можно сделать проверку - вы сами даёте текст (желательно какой-нибудь рассказ 30-50К, чтобы сравнение не заняло слишом много времени), я запускаю программу на последней выложенной версии (чтобы не мог "подстроить алгоритм"), без дополнительных словарей (кроме "Поиск неизвестных слов" с расстановкой ударений, хотя можно и без этого)) и мы проверяем число ошибок... Режим только омонимы отключен. Глюки движков не считаются (т.е. если в тексте ударение стоит првильно, а движок читает некорректно - подобные вещи не учитываются).
- Цитата :
, давайте не будем хотя бы в этой теме саморекламой заниматься и выдавать желаемое за действительное.
Так в теме есть несколько человек, которые уже пользуются Книгоделом и вполне довольны... Какая уж тут самореклама...
- Цитата :
З.Ы. Если пользователь использует для обработки хлам, а не вычищенные словари, то и результат у него будет соответствующий.
Чистка словарей тут мало что даёт... Но если Вы считаете, что Ваш словарь- намного лучше, можно провести проверку и Вашей методики. Только текст в данном случае должно давать третье, нейтральное лицо... |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 02.03.09 19:36 |  |
| Воздержусь от оценки "книгодела", возможно подобная идея и имеет право на существование.Хотя на мой взгляд идея крайне утопическая. Просто отмечу, что тема подразумевает обсуждение словарей для Ольги. А как вы ответили в своей ветке, в ближайшей перспективе их создание вашей программой не планируется. Так что столь пространные споры только засоряют данную ветку форума и создают ошибочные иллюзии в умах неопытных посетителей. Надеюсь здравый смысл возобладает и здесь будут обсуждаться именно словари. |
|
|
 | |
rquester V.I.P.
Сообщений : 137
Репутация : 16
 | 02.03.09 20:16 |  |
| Lexus
- Цитата :
- Хотя на мой взгляд идея крайне утопическая.
Чем же она утопическая, если она уже работает, причем лучше словарей dic.
- Цитата :
Просто отмечу, что тема подразумевает обсуждение словарей для Ольги.
Так Книгодел с Ольгой работает и для него, в принципе, тоже можно писать словари (в основном - словари фразеологизмов, остальное он корректно отслеживает).
- Цитата :
А как вы ответили в своей ветке, в ближайшей перспективе их создание вашей программой не планируется. Так не "не планируется", а принципиально невозможно - не конвертируются данные в dic формат, никак... И это еще одна причина переходить на Книгодел(или что-то похожее, если найдётся) - возможностей словарей формата dic недостаточно.
- Цитата :
Так что столь пространные споры только засоряют данную ветку форума и создают ошибочные иллюзии в умах неопытных посетителей.
Какие "ошибочные иллюзии", когда программа уже существует и уже лучше аналогов? В ветке Книгодела, кстати, в основном, как раз опытные посетители сидят... |
|
|
 | |
Mago Постоялец
Сообщений : 77
Репутация : 8
 | Mago | :: 30.04.09 21:32 |
30.04.09 21:32 |  |
| А как заставить правильно читать слово "авторитетны". Читает как "авторитэтны" |
|
|
 | |
however63 Новичок
Сообщений : 10
Репутация : 1
 | 01.05.09 11:05 |  |
| Maqo попробуй вот так авторитетны=авторитьэтны "авторитетны" = "\SAMPA=(Vft@r'it'"Etn1#)" Как правильно и в какие словари заносить подобные слова не знаю и сколько вообще словарей нужно в Балаболке, MP3book2005, …
Неплохо было бы кто нить из опытных написал FAQ для новичков |
|
|
 | |
Mago Постоялец
Сообщений : 77
Репутация : 8
 | Mago | :: 01.05.09 11:46 |
01.05.09 11:46 |  |
| Спасибо, оба варианта работают. Надо заносить либо первое в словарь Балаболки, либо второе в *.lex файл (loqlexerом) |
|
|
 | |
Stroodder V.I.P.
Сообщений : 98
Репутация : 7
 | 01.05.09 20:53 |  |
| Mago Ну так как Ольга, благодаря Йишику (его и еще одного комрада кстати надо благодарить), стала доступной, появилась прога Phonolgaph, а потом уже LoqLexer, на которых можно испытывать транскрипцию. Поищи в форуме, я эти утилиты для изучения Ольги и писал. |
|
|
 | |
Mago Постоялец
Сообщений : 77
Репутация : 8
 | Mago | :: 01.05.09 23:26 |
01.05.09 23:26 |  |
| Stroodder, эээ..ты вообще о чём? 
- Цитата :
- Надо заносить либо первое в словарь Балаболки, либо второе в *.lex файл (loqlexerом)
Это было утверждение... |
|
|
 | |
however63 Новичок
Сообщений : 10
Репутация : 1
 | 02.05.09 8:28 |  |
| Stroodder неплохо было бы взглянуть на Phonolgaph |
|
|
 | |
however63 Новичок
Сообщений : 10
Репутация : 1
 | 02.05.09 11:33 |  |
| Maqo
- Цитата :
- Надо заносить либо первое в словарь Балаболки
поточнее в какой именно |
|
|
 | |
Mago Постоялец
Сообщений : 77
Репутация : 8
 | Mago | :: 02.05.09 13:02 |
02.05.09 13:02 |  |
| Ну как в какой? В любой. У программы балаболка есть возможность использования словарей. Нажимаем соответствующую кнопочку на тулбаре и справа появляется список словарей где их можно подключать/отключать/создавать/удалять/редактировать |
|
|
 | |
however63 Новичок
Сообщений : 10
Репутация : 1
 | 03.05.09 10:20 |  |
| Maqo
- Цитата :
- Ну как в какой? В любой.
в любой не пойдёт. Для чего тогда столько слоарей? |
|
|
 | |
Mago Постоялец
Сообщений : 77
Репутация : 8
 | Mago | :: 03.05.09 21:03 |
03.05.09 21:03 |  |
| для удобства |
|
|
 | |
SergeiSP Новичок
Сообщений : 19
Репутация : 0
 | 05.05.09 15:49 |  |
| Так все-таки, какой на данный момент оптимальный словарь для Ольги? |
|
|
 | |
however63 Новичок
Сообщений : 10
Репутация : 1
 | 05.05.09 21:40 |  |
| SergeiSP словари + новые слова |
|
|
 | |
AlexDJ Наблюдатель
Сообщений : 2
Репутация : 0
 | 02.06.09 11:21 |  |
| Скажите а можно ли самому создавать или редактировать эффекты типа смех пчих и т.д.? |
|
|
 | |
druss87 Интересующийся
Сообщений : 5
Репутация : 2
 | 04.06.09 2:18 |  |
| Здравствуйте!!! Скажите, пожалуйста, как исправить глюк с окончаниями слов, заканчивающимся на согласные буквы, если ударная гласная стоит перед последней согласной. Ольга делает во всём слове (до знака ударения) ударение правильно, а согласную букву читает отдельно. Т.е., например: оди' ^'н - читает как - [ади эн], капита' ^'л - как - [капита эл], сравни' ^'ть - [сравни тэ мяхкий знак]. Читаю Балаболкой, Подготавливая текст Книгоделом. Кстати, словаря, example.lex в указанной директории (C:\Program Files (x86)\Loquendo\LTTS7\bin) нет. Может у меня с настройками Балаболки что-то не то? |
|
|
 | |
Moro Наблюдатель
Сообщений : 1
Репутация : 0
 | Moro | :: 23.06.09 21:27 |
23.06.09 21:27 |  |
| Словарей много, а какие оптимально подключаете на Ольгу? Тут, как я понимю такой вариант, что можно маслом кашу испортить :-) |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 24.06.09 11:36 |  |
| - Цитата :
- Тут, как я понимю такой вариант, что можно маслом кашу испортить
Берете готовые и творчески перелопачиваете , так как очень много ошибок.
Группа по созданию словарей напоминает хорошо законспирированную группу революционеров-заговорщиков. Что на мой взгляд только вредит делу |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 25.06.09 22:41 |  |
| дада подтверждаю lev55 умничка, сам словари проверяет, это очень сложно поверьте если со словарями Аленки более менее, хотя тоже есть свои моменты, то для Ольги все думают что они "словари" будут делаться сами а я просто подожду и скачаю потом, может, если конечно захочу, и тоже может быть  |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 26.06.09 11:23 |  |
| На мой взгляд, созданию словарей препятствует не пассивность пользователей, а недостатки программных средств, информации о словарях и сама методика их создания.
Тот же LoqLexer остановился в развитии и несмотря на все его достоинства, очень сырой, при проверке словарей может зажевывать правила, да и в плане удобства не помешали бы доработки в нем. Средства самой Ольги (java) по созданию словарей очень прожорливы и громоздки . Да и методы создания правил с пресловутым ' ^' отпугивают многих своей неоднозначностью . При обработке таких правил в читалках есть вопросы. Возможно и организация процесса уступает той же Алене.
Судя по составу участников считал что разработкой словарей Ольги занимается группа по созданию "Специализированных корпусных словарей". Теперь понял, что это не так. |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 29.06.09 23:00 |  |
| Как я понял lev55 мыслит масштабами космических кораблей. А нам, смертным хорош был бы и простой трактор. Не вдаваясь в заоблочные выси лексической омонемии хотелось бы иметь словари обычных слов (не омографов), которых миллионы и которые Ольга произносит неправильно. А для этого достаточно того же хорошо известного loqlexera и конечно же словарной базы. Вот именно эта база, обязательно с проставленными ударениями и может стать основой базового словаря для ольги. Пресловутый словарь Зализняка к Ольге уже прикручен. Аминь. Но это лишь капля во многомиллионом море русского языка. Добавляя по паре сотне слов каждым пользоватем проблему не решит, так как для этого потребуются годы, а за это время появится более совремнный движок. И все начнется сначала.
Нужно идти по пути поиска означенных словарей
Можно взять пример у rquester в его книгоделе:
- Цитата :
- Во-первых используется далеко не словарь Зализняка:
а)Он значительно пополнен (например, именами и географическими названиями, которых у Зализняка в принципе нет, кроме того, значительно пополнен сам словарь - фантастические, компьютерные термины и т.д. (написан собственный редактор словоформ, правда, пока не особо удобный для конечных пользователей...
Это всего лишь возможные направления. |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 30.06.09 21:44 |  |
| - Цитата :
- Пока у меня на час прослушивания 1-2 ошибки, не учитывая имён и числительных.
Ну так это ведь в одной книжке, умножьте на 8 часов (средняя книга)ну и хотя бы 130 тыс (кол-во книг в одной из эл. библиотек)
- Цитата :
- Пусть Lexus этим и займётся. Я умываю руки.
Это Вы зря, уважаемый. В спорах рождается истина. |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 01.07.09 11:03 |  |
| Вообще-то если 1000 человек пришлет по 2000 слов, то теоретически получится приличный словарь, почти на все случаи жизни. Но опять же, откуда возьмётся 1000 любителей ольги. Ведь это должны быть очень даже грамотные в компьютерном деле люди. Плюс увлекающиеся чтением, чтобы прочитать 130 книг, да ктому же просто грамотные, чтобы знать как произносятся и пишутся слова. Ну а поскольку люди эти будут примерного одного образовательного уровня, то и читать они будут примерно один и тот же список книг. Следовательно вся библиотека никогда не будет охвачена и словарь никогда не будет полным. Вывод - TTS и словари тоько тогда будут качественными, когда станут массовыми т.е. всенародными, а не элитарными. Несколько маленьких шагов благодаря созданию форума сделано. Но как распиарить эту идею до уровня домохозяек нужно думать дальше. |
|
|
 | |
Mago Постоялец
Сообщений : 77
Репутация : 8
 | Mago | :: 08.07.09 12:54 |
08.07.09 12:54 |  |
| В некоторых словах Ольга глотает в конце букву и, например - бобами. Как с этим бороться? |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 08.07.09 15:27 |  |
| бобами=боб^аами |
|
|
 | |
king Новичок
Сообщений : 24
Репутация : 0
 | king | :: 09.07.09 17:12 |
09.07.09 17:12 |  |
| Всё по порядку установил со странички Словари до момента:
Reg -файл для Ольги depositfiles.com kcu8z6h0n , там всё прописано.
С depositfiles не смог скачать. Этот файл обязательно устанавливать, или он нужен только для словарей николая? Если найду неправильные слова, то через форму в какое окошко писать. Например:
Гражданская война, продолжавшаяся с 1936 по 1939 год,
в балаболке после всех операций:
Гражданская война, продолжавшаяся с 1936 по тысяча девятьсот, |
|
|
 | |
olvlad Наблюдатель
Сообщений : 1
Репутация : 0
 | 25.07.09 0:37 |  |
| подскажите кто знает я установил балаболку и Ольгу словарь подключил но читает очень быстро и скорость не меняется регулировкой что это может быть ? |
|
|
 | |
Mago Постоялец
Сообщений : 77
Репутация : 8
 | |
 | |
Mago Постоялец
Сообщений : 77
Репутация : 8
 | Mago | :: 14.09.09 1:44 |
14.09.09 1:44 |  |
| lev55, Это вам большое человеческое спасибо за то, что вносите основной вклад в словари Ольги
Основываясь на обновлённых словарях, прошу рассмотреть следующие предложения:
Если кинуть тот список слов в Балаболку, почему то первое слово читается неправильно (даже если поменять вонючая и вонючий местами) - но в реальных текстах я думаю всё будет в порядке
Вместо целых словосочетаний может лучше писать слова? борьба,=борьба; "нервы" = "\SAMPA=(#n'y"erv1#)" юношей=-юношей "присылайте" = "\SAMPA=(pr'is@5"aLt'y@)" "терпимо" = "\SAMPA=(#t'@rp'"imV#)" "идеи" = "\SAMPA=(#id'y"ei#)" "армии" = "\SAMPA=(#"armii#)" проделка,=проделка;
истерик может можно и без запятой? "истерик" = "\SAMPA=(ist'y"er'ik#)"
"Ася" произносится как Аса, может лучше так? Ася=^Асия
прошелестев=прошелесте' ^'в - так не пойдёт, читает "прошелестевээ" |
|
|
 | |
Mago Постоялец
Сообщений : 77
Репутация : 8
 | |
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 14.09.09 14:19 |  |
| lev55 С обновленным SAPI в балабокином словаре заработали ли конструкции с sampa. Или это тоже пока еще фантастика. |
|
|
 | |
Mago Постоялец
Сообщений : 77
Репутация : 8
 | |
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 14.09.09 16:24 |  |
| Если в текстовое окно балаболки записать \SAMPA=(#t@rp'"imV#). Прочтет ли она его или как и раньше только знаки. |
|
|
 | |
Mago Постоялец
Сообщений : 77
Репутация : 8
 | Mago | :: 14.09.09 16:51 |
14.09.09 16:51 |  |
| У меня читает знаки |
|
|
 | |
Mago Постоялец
Сообщений : 77
Репутация : 8
 | Mago | :: 14.09.09 18:50 |
14.09.09 18:50 |  |
| lev55 Спасибо, друг!!. Именно этого значения в реестре у меня в компе и не хватало. Прошу прощения за невнимательное чтение страницы со словарями. А на что нибудь ещё кроме слова прошелестев это оно влияет? |
|
|
 | |
flint2 Посетитель
Сообщений : 43
Репутация : 11
 | 16.09.09 18:25 |  |
| Подскажите, как отредактировать слова в лексиконе, или в словаре, или другим методом
- Цитата :
- кал^оша
пор^оша т^уша и им подобные, которые кончаются на "оша" или "ша"? |
|
|
 | |
flint2 Посетитель
Сообщений : 43
Репутация : 11
 | 08.10.09 16:01 |  |
| И ещё. В лексиконе слова типа кастетом=kVst'@"et@m# добовляется Y и @ между смягчающим знаком и "ударением" - '". Я пробовал заменять ", и ." на ; и :. Помоемому нормально. |
|
|
 | |
muk79 Участник «online словари»
Сообщений : 103
Репутация : 29
 | 28.12.09 16:52 |  |
| - Цитата :
- Понятно, что путь включает в себя юзера, поэтому, как вариант, можно обозначить директорию, допустим C:\словари Ольга и туда скачивать-проверять из этой директории. А из неё уже переносить ручками в укаанные выше директории.
Сейчас обновлялка все словари копирует в папку dictionary в подпапку для каждого голоса - для Алены это dictionary\alyona для Ольги это будет dictionary\olga а оттуда уже руками копировать куда нужно. Так подходит?
Автоматическое копирование самих словарей вместо старых делать не хочу потому что один случайный сбой и будет много мата Будут обновляться только сами архивы как они есть на сайте(сайтах).
- Цитата :
- трудно жить во время перемен) китайская мудрость.
Это скажи спасибо evilone за настырность. Сидеть сложа руки легче всего за чужой спиной и если лень уступит - победит пьянство Кстати о приятном, всех с наступающими! |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 29.12.09 8:17 |  |
| Все-же информация о времени обновления словарей в ветке или их версия очень желательны. Не у всех хороший доступ в нет. |
|
|
 | |
muk79 Участник «online словари»
Сообщений : 103
Репутация : 29
 | 28.03.10 22:26 |  |
| evilone_ Аленкин словарь запросто подходит к Ольге только нужно перевести большие буквы в ' ^' на подобии O+lga.dic только без плюсов.
Все ссылки в проверялке уже не рабочие, я так понимаю словари будут другие уже? |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 31.03.10 7:05 |  |
| так, сделали вам словарики для возможности чтения ольки со словарями аленки на лету без каких-либо лишних действий, работает пока только для стандартного метода замен
подключать как и у аленки нужно два словаря (словарь замен и словарь корректор) плюс дополнительный словарь для перевода ударений в формат ольки:
corector-olga.ini (корректор) alenka-to-olga.dic (ударения) omograph.dic (аленкин словарь)
попробуйте, вдруг будут ошибки
lev55 а такие правила точно работали? у меня есть более ранняя версия 390 но в ней
- Цитата :
- *олет=олёт
пистолет=пистолет Длжно получится - пистолет. получается всегда пистолёт при любом методе  |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 31.03.10 17:45 |  |
| - Цитата :
- Поясните, зачем это в corector-olga.ini, вроде будет только портить.
механизм там такой: -сначала идет обработка текста ini корректором (корректируется тире, пробелы между словами и знаками препинания и прочая ерунда) плюс идет замена всех заглавных гласных на строчные - далее идет обработка двумя dic словарями (сначала, поскольку правила самые длинные, срабатывает словарь замен omograph.dic а за ним словарь для перевода ударений поскольку в нем самые коротенькие правила)
правила убирающие заглавную гласную в словах по тексту нужны для того чтобы при замене словарем ударений замены вида
- Цитата :
- $*О*=^о
$*У*=^у $*Ы*=^ы $*Э*=^э
не меняли заглавные безударные букавки на ударения и олька их произносила правильно, например
- Цитата :
- Они назвали море, залив и материк именем Росса. Они назвали горы именами своих друзей и покровителей. Они нарекли два вулкана, видневшихся на горизонте, в честь своих кораблей - вот этих самых кораблей, – дав дымящимся горам названия Террор и Эребус.
получится
- Цитата :
^они назвали море, залив и материк именем Росса. ^они назвали горы именами своих друзей и покровителей. ^они нарекли два вулкана, видневшихся на горизонте, в честь своих кораблей - вот этих самых кораблей, – дав дымящимся горам названия Террор и Эребус. ерунда получится
просто у аленки ударение указывается в виде заглавной буквы в словах, но если слова нет в лексиконе то ей все равно какие там буквы в слове, заглавные или строчные у ольки в принципе тоже но поскольку словарь для перевода ударений простой до безобразия то при переводе для простоты все гласные переводятся в строчные потому что словарь ударений будет ставить ударение для всех гласных - и ударных и безударных, а это неправильно
можно и через плюсы но тогда, для того чтобы можно было пользоваться словарем аленки, нужно сперва заглавную перевести в строчную с плюсом а потом строчную с плюсом перевести в ударение, это долго и читать на лету уже не получится
у меня ольки установленной нет и я не могу проверить как она читает, но визуально вроде работает попробуйте послушать какой-то текст, как оно будет читать, если плохо то выкинем, если нормально то будет как запасной или альтернативный вариант |
|
|
 | |
flint2 Посетитель
Сообщений : 43
Репутация : 11
 | 09.04.10 10:00 |  |
| Lev55 Есть предложение. После того, как стали обрабатываться двойные слова с чёрточкой, то наверное надо избавиться от старого наследия в словарях. Такие правила Беркли-сквер=Беркли-скве' ^'р, Анка-пулеметчица=Анка-пулемётчица и Брайтон-Бич=Бр^айтон-Бич надо заменить на сквер=скве' ^'р, пулеметчица=пулемётчица и Брайтон=Бр^айтон а такие *-вахтера=-вахтёра и ковер-самолет=ковёр-самолёт )) вообще ненужны! Предлагаю разделить эту работу надвоих. Я возьму словарь Ё-моё, а ты 1Olga или наоборот. Ку или не Ку? |
|
|
 | |
|
Обсуждение словарей |
---|