| Бета-версия 2.0 (с поддержкой формата Юникод) | |
|
|
Автор | Сообщение | Бета-версия 2.0 (с поддержкой формата Юникод) |
---|
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 05.09.09 2:10 |  |
| На сайте программы "Балаболка" доступна для скачивания бета-версия с поддержкой Юникода: http://www.cross-plus-a.com/balabolka_beta.zip
Системные требования: Microsoft Windows 2000/XP/2003/Vista
*** Важно ***
Версия 2.0 БЕТА распространяется только в ознакомительных целях. Это не готовый программный продукт, поэтому использовать программу следует с осторожностью.
Эта версия "Балаболки" поддерживает Юникод (кодировки UTF-8, UTF-16LE и UTF-16BE), поэтому станет возможным читать иностранные тексты на компьютере с русскими региональными установками. Однако, голоса SAPI 4 и некоторые старые версии голосов SAPI 5 не поддерживают Юникод, поэтому для чтения иностранных текстов следует использовать лишь новейшие версии голосов SAPI 5.
*** Словари ***
Все словари для коррекции произношения и списки омографов хранятся в файлах с кодировкой UTF-8. Если возникнет необходимость использовать такой словарь в версии 1.27 программы "Балаболка", его следует сохранить в кодировке ANSI (например, это можно сделать в программе Notepad ("Проводник") операционной системы Windows).
*** Текстовые файлы ***
"Балаболка" запоминает кодировку каждого открываемого в программе текстового файла, а затем использует эту информацию для сохранения измененного текста в нужном формате. Значение кодировки можно изменить при помощи пункта главного меню "Сохранить как".
Возможны ситуации, когда программа некорректно определяет кодировку текста при чтении файла. В качестве временного решения этой проблемы можно посоветовать повторно сохранить текстовый файл в той же самой кодировке, в каком-либо текстовом редакторе - например, в программе Notepad ("Проводник"), входящей в состав операционной системы Windows.
*** Проверка орфографии ***
Проверка орфографии, увы, по-прежнему обрабатывает текст в кодировке ANSI. Это означает, что на компьютере с русскими региональными установками можно проверять правописание текстов на русском языке, но не на иностранных языках.
*** Перевод интерфейса на другие языки ***
Файлы переводов интерфейса на другие языки хранятся в формате UTF-8. Чтобы надписи на других языках корректно отображались при любых региональных установках, для всех визуальных компонентов (кнопок, выпадающих списков и т.п.) шрифт был изменен с "MS Sans Serif" на "Microsoft Sans Serif".
Буду признателен за любые замечания и сообщения о найденных ошибках в работе бета-версии. Просьба указывать номер версии программы "Балаболка" и версию операционной системы Windows. |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 05.09.09 12:39 |  |
| ура, дождались!!! :117: :117: юникод это хорошо :131: попробуем а старые словари получается нужно теперь все перевести в uft для этой версии? или можно пользоваться одними и теми де для ansy и unicode варианта? |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 05.09.09 14:14 |  |
| - evilone_ пишет:
- а старые словари получается нужно теперь все перевести в uft для этой версии? или можно пользоваться одними и теми де для ansy и unicode варианта?
Старые словари можно открывать в новой версии без какой-либо конвертации; но по умолчанию в новой версии словари будут сохраняться как UTF-8. Есть кнопка "Сохранить как", можно при сохранении файла поменять его кодировку на ANSI - на тот случай, если понадобится перенести словарь из новой версии в старую.
Вообще, хочу добавить, что поддержка Unicode нужна лишь тем пользователям, которые хотят читать иностранные тексты на компьютере с русскими региональными установками. Тем же, кто слушает только русские тексты, нет никакой необходимости бросаться скачивать бета-версию (она еще долго будет "бета", так как я не намерен в ближайшее время переводить все свои программы на поддержку Юникода). |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 06.09.09 16:55 |  |
| а теперь о грустном... при работе со старым ini словарем некоторые слова стали читаться с паразитными звуками на конце (ющ ящ) иногда добавляет какие-то цифры в конец слова знак плюс и т.д. такое чувство что не правильно обрабатываются правила замены словарем может такое быть? |
|
|
 | |
lev55 Участник «online словари»
Сообщений : 384
Репутация : 45
 | 06.09.09 19:30 |  |
| evilone_ Сударыня, не пользуйтесь "ini", даже если это Алёна. Как доктор говорю ;-)) |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 06.09.09 20:09 |  |
| - evilone_ пишет:
- при работе со старым ini словарем некоторые слова стали читаться с паразитными звуками на конце (ющ ящ) иногда добавляет какие-то цифры в конец слова знак плюс и т.д.
Что ж, вполне такое может быть. Что такое "старый ini словарь", где взять этот файл, для какого он голоса? Можете ли привести пример 2-3 предложений с ошибками в применении правил? Спасибо. |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 06.09.09 21:46 |  |
| ну например вот такой текст в столбик прочитать все вместе
- Цитата :
- 26 апреля
26 июля 26 июня 6 этаже
с вот этим словарем самое интересное что если записать в мп3 то читает нормально а если слушать из программы но проскакивают безобразия, у меня тут проскакивает слово "собачка" старый в смысле к не юникод-версии голос аленка (2.220) лексиконы: "Лексикон для словаря замен" "Лексикон трудночитаемых слов" "Лексикон запрета чтения разделительных знаков" в самой программе подключен только этот словарь региональные настройки "русский" winxp sp2ru загрузка цп 4-5%
- Цитата :
- не пользуйтесь "ini", даже если это Алёна.
Как доктор говорю ;-)) к хорошему быстро привыкаешь  |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 06.09.09 22:20 |  |
| Увы, ищите источник проблемы в тех лексиконах, что установлены на Вашей машине. Я недавно переустановил операционную систему и все программы; "Алена" стоит у меня "чистая", без каких-либо дополнительных лексиконов, так что приведенный Вами пример текста вместе с подключенным INI-словарем читается абсолютно правильно.
Похоже, что правила из INI-файлов применяются к тексту в Юникоде нормально, а Lexicon Manager голоса "Алена" с Юникодом не дружит. 
Буду разбираться еще; спасибо за информацию. |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 07.09.09 13:01 |  |
| Прежде,чем скачивать интересует вопрос: Версия с поддержкой Юникода - Portable или обычный инсталятор. Не хотелось бы перезаписывать имеющийся Bild. Для экспериментов Portable более удобна. |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 07.09.09 13:15 |  |
| Да, бета - это "portable" вариант; ни в другие папки, ни в системный реестр она ничего не пишет. |
|
|
 | |
lev55 Участник «online словари»
Сообщений : 384
Репутация : 45
 | 08.09.09 14:34 |  |
| balabolka "ни в другие папки, ни в системный реестр она ничего не пишет. " Это по нашему, по бразильски! Здо' ^'рово! P.S. ( "А Крафаген должен быть сожжон!" Ну будь человеком, сделай опцию с ударением " ' ^' " , а то новую версию каждый раз поновой надо "ломать". Можно это привязать к голосу "переменная" и т.д.) |
|
|
 | |
cmhdream Новичок
Сообщений : 20
Репутация : 20
 | |
 | |
lev55 Участник «online словари»
Сообщений : 384
Репутация : 45
 | 08.12.09 15:11 |  |
| balabolka Понял. Спасибо! P.S. каким знаком ударение обозначить- не суть важно, важно - только чтоб правильно было. А по мофологическим признакам ударения ставить - куда гораздей. |
|
|
 | |
Lexus Эксперт
Сообщений : 413
Репутация : 32
 | 23.12.09 11:59 |  |
| balabolka Интересует вопрос, в какой кодировке получает текст движок в ANSI или UNICODE. Вопрос не праздный - цель заставить Ольгу воспринимать тег \Sampa. В этой связи еще один вопрос автору, может как-нибудь попробовать поэкспериментировать с вариантами UNICODE , чтобы решить эту задачу? В родных утилитках Loquendo тег работает. Это очень поможет обойти баги движка. |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 23.12.09 16:42 |  |
| - Lexus пишет:
- Интересует вопрос, в какой кодировке получает текст движок в ANSI или UNICODE.
В версии 2.0 текст передается в кодировке Unicode - ради этого всё и затевалось. Но это только для SAPI5 (голоса SAPI4 не работают с Юникодом).
Нет никаких подтвреждений тому, что в голосах Loquendo поддерживаются специализированные теги при работе через SAPI; есть поддержка только стандартных тегов SAPI. Специальные теги поддерживаются только при доступе к голосу через "родной" API от Loquendo. |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 06.06.10 20:17 |  |
| В меню программы добавлен пункт "Перевести": вообще-то, я делал его для одной программы на заказ, но решил ради эксперимента вставить и в "Балаболку". Эта функция будет присутствовать лишь в бета-версии, так как для нормального отображения букв иностранных языков без Юникода не обойтись.
Перевод осуществляется при помощи онлайн-сервиса Google; документацию по работе этого сервиса можно посмотреть здесь: http://code.google.com/intl/ru-RU/apis/ajaxlanguage/documentation/
Программа делит большой текст на части и посылает данные на сервер Google маленькими порциями, так что, если пользователь решит одним махом перевести текст размером один мегабайт, это приведет к тысяче запросов в адрес сервера Google. Я бы не рекомендовал так делать, так как не могу предвидеть реакцию на подобный "поток" запросов со стороны Google или со стороны Вашего местного провайдера. Но, теоретически, можно таким образом переводить с одного языка на другой и очень большие по размеру тексты. |
|
|
 | |
Nick0lay Наблюдатель
Сообщений : 1
Репутация : 0
 | 23.10.10 3:25 |  |
| Приветствую ! Я пытаюсь использовать Балаболку для чтения книг по покеру, скажите а значок "масти карты" (черва, трефа) это спецсимвол ? смогу ли я в словаре показать что надо читать - "туз трефовый" и тд. ? и как это сделать ?
оно читает как "полоса" и с словаре не могу никак сделать что б читало нормально 
помогите пожалуйста ! |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
| Бета-версия 2.0 (с поддержкой формата Юникод) | |
|
Бета-версия 2.0 (с поддержкой формата Юникод) |
---|