| Словарь склонения числительных | |
|
|
Автор | Сообщение | Словарь склонения числительных |
---|
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 11.12.10 23:06 |  |
| Словарь склонения числительных авторы: muk79, evmir, evilone
В словаре используются правила на основе регулярных выражений работающие только по стандарту PCRE. Данный словарь предназначен для использования в программах для чтения вслух и записи в аудиофайл текстовых файлов с использованием пакетов речевых функций SAPI4\SAPI5 с поддержкой ini-словарей (использующих регулярные выражения) (балаболка или демагог).
Словарь предназначен для склонения порядковых и целых числительных. Склоняются любые числа от одного до четырёх знаков в т.ч. римские (кроме упрощенной формы) путём дописывания к числу нужного окончания или специальной падежной метки определяющей правило склонения числа. Для использования достаточно применить шаблон который будет добавлять к числу нужное окончание, например:
- Код:
в начале XIX века= в начале XIX-ого века в начале девятнадцатого века
- Код:
в 1991 году=в 1991-м году в одна тысяча девятьсот девяносто первом годУ
- Код:
в 2-х этажном= в 2-ом этажном в двухэтажном
- Код:
глава 3=глава 3-я глава третья и т.д. Структура словаря:
Римские цифры преобразование римских чисел в арабские и шаблоны склонения здесь же до строки <рим\.ч\.>= можно использовать замены специфические только для римских чисел, например Петр I, Генрих IV и т.п., часть для примеров уже есть
Время преобразование и шаблоны склонения времени записанных в сокращенном виде 21:45\21:45:18\21.45 для использования в шаблонах падежного склонения используйте метку падежа согласно таблице
Даты преобразование и шаблоны склонения различных дат записанных в сокращенном виде 01.01.01\01.01.2001 8мар 1апр для использования в шаблонах падежного склонения используйте метку падежа согласно таблице
Длина преобразование и шаблоны склонения различных длин записанных в сокращенном виде 1м 100км для использования в шаблонах падежного склонения используйте метку падежа согласно таблице
Вес преобразование и шаблоны склонения различного веса записанных в сокращенном виде 1т 100кг для использования в шаблонах падежного склонения используйте метку падежа согласно таблице
Объем преобразование и шаблоны склонения различных объемов записанных в сокращенном виде 1л 100мл для использования в шаблонах падежного склонения используйте метку падежа согласно таблице
Валюта преобразование и шаблоны склонения различных валют записанных в сокращенном виде 10$ 100руб. для использования в шаблонах падежного склонения используйте метку падежа согласно таблице
Координаты преобразование и шаблоны склонения координат (градусы и минуты) записанных в сокращенном виде 40°31' для использования в шаблонах падежного склонения используйте метку падежа согласно таблице
Биты и байты преобразование и шаблоны склонения бит и байт записанных в сокращенном виде 100Гб 5Mb для использования в шаблонах падежного склонения используйте метку падежа согласно таблице
Общие шаблоны здесь возможно добавление новых шаблонов для замен по тексту, часть для примеров уже есть
Сокращения добавление текстовых сокращений, часть для примеров уже есть
Цифровые окончания сам словарь замен Использование метки падежа при составлении шаблонов склонения Метка падежа t служит для быстрой записи необходимого падежного склонения для числительного и стоящего рядом с ним слова.
- Цитата :
Формат записи для определения падежа числительного:
число<t@#> число-абв
Формат записи для определения падежа стоящего рядом слова:
время: часы <hr> минуты <min> секунды <sec>
дата: день <dd> неделя <wek> месяц <mm> месяц <mnth> год <yy>
длина: метр <mt>
вес: грамм <gr> тонна <tn> | объем: литры <lt>
валюта: доллар <usd> цент <cnt> рубль <rub> гривна <grn> копейка <cop> евро <eur> евроцент <ecn> | координаты: градус <gra> процент <per> минута <min>
биты и байты: биты <bit> байты <byt> степени: тысячи <tis> миллионы <mln> миллиарды <mlrd> |
где #(падеж) число от 1 до 6 @ числовая группа (род число и одушевленность) - латинская буква
В шаблоне при записи отдельно можно использовать как метку с числительным, с указанием группы числа, так и буквенное окончание. Использовать метку для стоящего рядом слова можно использовать без указания группы числа. Отдельно использовать метку только для стоящего рядом слова нельзя. Например:
- Цитата :
- 18 мин=18<t1><min>
около 18=около 18<tb2> около 18=около 18-го
- Цитата :
- Буквенные окончания:
-го -му -им -ом -а -ой -у -ою -о -ими -их -и | ноля нолю нолём ноле ноль ноля ноль нолём ноль нолями нолях ноль | одного одному одним одном одна одной одну одною одно одними одних одни | двух двум двумя двух две двух две двумя два двумя двух два | -ый -ого -ому -ым -м -я -й -ю -е -х -ые -ми | нулевой нулевого нулевому нулевым нулевом нулевая нулевой нулевую нулевое нулевых нулевые нулевыми | первый первого первому первым первом первая первой первую первое первых первые первыми | второй второго второму вторым втором вторая второй вторую второе вторых вторые вторыми |
-ро -ых -рым -ро -ых -ыми -ах | двое двоих двоим двое двоих двоими двоих | трое троих троим трое троих троими троих | четверо четверых четверым четверо четверых четверыми четверых |
Полная таблица всех окончаний
- Цитата :
- Буквенные окончания для различных значений падежных меток и групп чисел:
t 1 2 3 4 5 6 | | A
-го -му
-им -ом м.р.к. | D -ый -ого -ому -ый -ым -м м.р.п. | B -а -ой -ой -у -ой -ой ж.р.к. | E -я -й -й -ю -й -й ж.р.п. | H -о -го -му -о -им -ом с.р.к. | C -е -ого -ому -е -ым -м с.р.п. | G -и -их -их -и -ими -их мн.к. | t 1 2 3 4 5 6 | | F -ые -х -х -ые -ми -х мн.п. | J
-го -му -го -им -ом од.м.р.к. | K -ый -ого -ому -ого -ым -м од.м.р.п. | L -а -ой -ой -ой -ой -ой од.ж.р.к. | M -я -й -й -й -й -й од.ж.р.п. | N -и -их -их -их -ими -их од.мн.к. | O -ые -х -х -х -ми -х од.мн.п. | t 1 2 3 4 5 6 | | P -ро -ых -рым -ро -ыми -ах соб. | Q -ро -ых -рым -ых -ыми -ах од.соб. |
|
|
|
|
| м.р. - мужской род ж.р. - женский род с.р. - средний род мн. - множественное число п. - порядковые к. - количественные соб. - собирательные од. - одушевленное
Все ошибки и\или нужные шаблоны для замен пишите, пожалуйста, здесь
|
|
|
 | |
Rus Новичок
Сообщений : 12
Репутация : 3
 | Rus | :: 21.12.10 19:35 |
21.12.10 19:35 |  |
| Спасибо! Это лайт версия "Словарь замены для числительных и физических величин"? Как добавить такие вариации для коррекции чтения, написанных как : "50- х; 40- х; 50- й; 40- й" - пятидесятых; сороковых; пятидесятый; сороковой? Примечание 29.05.14: Словарь замены для числительных и физических величин полностью устарел - он не работает в новых в. TTS-программ! |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
MiKa85 Наблюдатель
Сообщений : 2
Репутация : 1
 | 19.02.12 17:41 |  |
| Здравствуйте. У меня такая проблема, неправильно читает месяцы, 06 - мартом обзывает, и так почти все с 04 по12, правильно называет только январь, февраль и март. Как будто других месяцев не знает.. Подскажите пожалуйста как это можно исправить. Пример где она ошибается: 12.06.1985 |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
MiKa85 Наблюдатель
Сообщений : 2
Репутация : 1
 | 21.02.12 22:05 |  |
| Это вам спасибо! Обновила, теперь все нормально  |
|
|
 | |
wedmed Интересующийся
Сообщений : 6
Репутация : 2
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
wedmed Интересующийся
Сообщений : 6
Репутация : 2
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 15.04.12 19:18 |  |
| wedmed, да, сейчас словарь именно так и делает замены - до 19-го включительно это 2000- а выше 1900+ я не помню почему именно до 19 но так уже получилось, потому что, по-моему, это была не моя идея 
если нужно (и нужно ли?) это изменить то оно настраивается строками 573 574 (# года)
- Цитата :
- <([01]?[0-9]):d(\d):t(\d)><yy:d(\d):t(\d)>=<20$1:d$2:t$3><yy:d$4:t$5>
<([2-9]?[0-9]):d(\d):t(\d)><yy:d(\d):t(\d)>=<19$1:d$2:t$3><yy:d$4:t$5>
если я правильно все понимаю то предложение сделать "плавающую \ настраиваемую" первую часть для года если дата имеет сокращенный вид хх-хх-хх (1920+\2019-; 1820+\1919-; 1720+\1819-; ... ), так? или не так? или просто добавить маркер на дату хх-хх-хх?  |
|
|
 | |
wedmed Интересующийся
Сообщений : 6
Репутация : 2
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
wedmed Интересующийся
Сообщений : 6
Репутация : 2
 | 20.04.12 9:04 |  |
| - evilone_ пишет:
- очень сложно получится, надо будет вспоминать про такие даты каждый раз при разметке текста
Кому лень вспоминать и в случае упоминания многих веков можно "переменной" присвоить "пустое место". Тогда всё само сведётся к шаблону хх-хх-хх, а желающие смогут указывать нужные века. |
|
|
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 20.04.12 11:22 |  |
| - wedmed пишет:
- желающие смогут указывать нужные века.
Простите но... а если желающим непонятно как это делается - не все разбираются в регулярных выражениях! |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
wedmed Интересующийся
Сообщений : 6
Репутация : 2
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
wedmed Интересующийся
Сообщений : 6
Репутация : 2
 | 25.04.12 15:52 |  |
| - evilone_ пишет:
- переменные не нужны, достаточно простого шаблона
конечно можно попробовать, может это тоже окажется достаточно удобно. Но ...
- evmir1 пишет:
- Простите но... а если желающим непонятно как это делается - не все разбираются в регулярных выражениях!
Неразбирающимся придётся смирится и не включать шаблон.
P.S. если что, то для себя я смогу написать пару строчек, какие нравятся  |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
bm_s Наблюдатель
Сообщений : 1
Репутация : 0
 | bm_s | :: 31.07.12 6:28 |
31.07.12 6:28 |  |
| Словарь не работает на запись в мр3. При чтении все ок. Что предпринять? |
|
|
 | |
Dekabrus Участник
Сообщений : 61
Репутация : 3
 | 11.09.13 20:23 |  |
| проблемка с цифрами.
фразу = " В 1930 году была организована экспедиция" = читает правильно.
во фразе "..в сентябре 1930 года,.." читает " ...в сентябре года,. " без даты.
что делать?
|
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 12.09.13 22:45 |  |
| Dekabrus, в какой программе и с какими словарями? у меня все работает как положено # 11/01/2013
- Спойлер:
-
а сам словарь давно обновляли? |
|
|
 | |
rd123 Гость
 | rd123 | :: 11.02.14 17:08 |
11.02.14 17:08 |  |
| Пропускает текст, читает только выделенное жирным: "И вот наконец 27 марта 1978 года состоялось первое «горячее» испытание реактора 11Б91-ИР-100 (ИРГИТ) – такое имя получил будущий ЯРД. Это был так называемый энергетический пуск. Параметры его были весьма скромными, мощность 25 МВт (примерно 1/7 от проектной), температура водорода – 15000С, время работы а этом режиме – 70 секунд. Но не подумайте, что наши инженеры на 19 лет отставали от американцев! Очень скоро, в июле и августе 1978 года, тот же реактор на огневых испытаниях показал гораздо более высокие результаты!"
|
|
|
 | |
flegont V.I.P.
Сообщений : 355
Репутация : 475
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 14.02.14 22:40 |  |
| - flegont пишет:
- Такой результат дает правило ... из этого диковинного словаря chisla.rex
да, так работает, исправили  rd123, flegont спасибо |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 08.03.14 21:48 |  |
| мы обновились: - исправлены римские числа и шаблоны с ними; - добавлено склонение числительных с сокращениями тыс. млн. мрлд.; - добавлено склонение десятичных и целых дробей; - добавлено склонение числительных с новыми "стоящими рядом" словами (см. шапку); - проставлены ударения в омографах; - исправлены важные ошибки; - добавлено много много много новых шаблонов... |
|
|
 | |
kotbasikcom Новичок
Сообщений : 10
Репутация : 1
 | 17.06.14 7:29 |  |
| Доброго времени всем. Спрашивал в теме по работе и функционалу - Спойлер:
-
А не подскажет кто-нибудь, что нужно поправить, чтобы говорила "двадцать третьего и двадцать четвёртого мая", а то у меня лопочет "двадцать три и двадцать четвёртого мая". Словари все по инструкции отсюда -отправили сюда. А проблема такая. Для сохранения в аудиофайлы использую Балаболку последней версии, в ней с произношением чисел проблем вроде нет. Но при чтении на компе при подключенных словарях она делает паузы перед следующим после прочитанного фрагментом текста (не зависит предложение это, абзац или смешанный метод), без словарей пауз нет. Поэтому для чтения использую версию Балаболки 2.0.0.439 - она со словарями читает без пауз, но не понимает словарей .rex только .ini Пробовал просто менять расширение файлов словарей, создавал пустой ini и копировал в него содержимое rex - не проходит. Подскажите, пожалуйста, кто знает, как конвертировать .rex в .ini или что поправить в chisla.ini, чтобы Алёна читала правильно. А ещё лучше, что почитать, чтобы разобраться с "палочками и крючёчками" ;-) в словарях. |
|
|
 | |
made_in_Chuguev Наблюдатель
Сообщений : 4
Репутация : 0
 | 12.11.15 19:44 |  |
| Использую этот словарь совместно с голосовым движком "Татьяна" и при чтении к примеру
- Цитата :
- заплатят $ 77 миллионов за печеньки
он произносит как
- Цитата :
- заплатят 77 долларов за печеньки
И если убрать пробел между знаком доллара и цифрами, то ничего не изменится. Как можно это исправить? |
|
|
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | 12.11.15 23:58 |  |
| - made_in_Chuguev пишет:
- И если убрать пробел между знаком доллара и цифрами, то ничего не изменится.
Как можно это исправить? Надо же! И тут миллионами воруют...  |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
made_in_Chuguev Наблюдатель
Сообщений : 4
Репутация : 0
 | 14.11.15 12:05 |  |
| Прошу простить за невнимательность. Действительно у меня стояла версия 15/09/2014 и после замены её на последнюю эта проблема исчезла. Спасибо за подсказку. |
|
|
 | |
wised Наблюдатель
Сообщений : 1
Репутация : 1
 | 07.01.16 14:40 |  |
| Здравствуйте. Использую этот словарь совместно с голосовым движком "Татьяна" и при чтении к примеру:
в 2016 году - читает правильно - "в две тысячи шестнадцатом году" к 2016 году - читает не корректно - "к двадцатому шестнадцатому году" |
|
|
 | |
made_in_Chuguev Наблюдатель
Сообщений : 4
Репутация : 0
 | 07.01.16 14:50 |  |
| И у меня такая же проблема как у wisedа |
|
|
 | |
Surg Интересующийся
Сообщений : 5
Репутация : 1
 | Surg | :: 31.01.16 18:28 |
31.01.16 18:28 |  |
| made_in_Chuguev , wised Если ещё актуально. Уберите в этой строке второй от начала знак вопроса.
(\bк\b|\bко\b)\s(\d{2,4})\s?(\bи\b|\-)?\s?(\d{2,4})(\s(\bгоду\b|\bг\.|\bгг\.|\bгод\.))=$1 $2-ому $4-ому гОду
Должно быть так.
(\bк\b|\bко\b)\s(\d{2,4})\s?(\bи\b|\-)\s?(\d{2,4})(\s(\bгоду\b|\bг\.|\bгг\.|\bгод\.))=$1 $2-ому $4-ому гОду
Насколько я понял - этот словарь для всех голосов одинаковый? Интересно ещё посмотреть, чем отличаются корректирующие словари. Может кто выложит корректор от Алёны? |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 06.02.16 17:44 |  |
| да, этот словарь подходит для всех голосов отличия корректора Алены в специфических заменах для исправления ошибок произношения ряда слов
вот новая версия словаря ссылка на dropbox временно неактивна как только заработает то будет доступна и по старой ссылке  |
|
|
 | |
Surg Интересующийся
Сообщений : 5
Репутация : 1
 | Surg | :: 07.02.16 19:12 |
07.02.16 19:12 |  |
| Спасибо! Числа ещё и с комментами. А я столько времени убил, чтоб, хоть немного понять, что там к чему. |
|
|
 | |
| Словарь склонения числительных | |
|
Словарь склонения числительных |
---|