|
|
Автор | Сообщение | Nuance Milena TTS |
---|
apokrif V.I.P.
Сообщений : 331
 | 04.08.13 1:26 |  |
| - Dmitry пишет:
- apokrif, опять без инструкции
Инструкция в Vocalizer_Expressive_SAPI5_x86_readme.rar Установка на 100% совпадает с Vocalizer SAPI5. Единственная неувязка, autov5_sapi5.dll & ve_sapi5.dll имеют одинаковый CLSID {98BAB182-19A8-40d5-9268-1F84E1B7B257}, т.е. они взаимоисключающие.
Можно поменять CLSID на другой (например {98BAB182-19A8-40d5-9268-1F84E1B7B258}) и поправить все *.reg и ve_sapi5.dll (и не забыть поправить checksum)
|
|
|
 | |
Swk Посетитель
Сообщений : 26
Репутация : 1
 | Swk | :: 29.10.13 7:37 |
29.10.13 7:37 |  |
| apokrif Можете записать сравнительные семплы, например голоса Milena, до, и после установки Vocalizer Expressive. Естественно с оптимальными настройками произношения?
И ещё не маловажный вопрос, после установки Vocalizer Expressive не возникнут какие-либо проблемы того или иного вида?
|
|
|
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | 29.10.13 13:15 |  |
| - Swk пишет:
- Можете записать сравнительные семплы, например голоса Milena, до, и после установки Vocalizer Expressive. Естественно с оптимальными настройками произношения?
Там дело не семплах, а в наборе "глюков" произношения у Milen из Vocalizer и Vocalizer Expressive. Почитайте последние 5 страниц тут http://4pda.ru/forum/index.php?showtopic=200728
- Swk пишет:
- И ещё не маловажный вопрос, после установки Vocalizer Expressive не возникнут какие-либо проблемы того или иного вида?
"Проблема" только одна (IMHO)- apokrif пишет:
- Единственная неувязка, autov5_sapi5.dll & ve_sapi5.dll имеют одинаковый CLSID {98BAB182-19A8-40d5-9268-1F84E1B7B257}, т.е. они взаимоисключающие.
|
|
|
 | |
basist Гость
 | basist | :: 19.12.13 21:39 |
19.12.13 21:39 |  |
| Не могли бы, уважаемые знатоки, подсказать, какие файлы скачивать на 4пда, чтобы Милена звучала не только в демо вокализир. А то у меня выскакивает сообщение "Данный голос не может быть воспроизведён." Мне там трудно самому во всём разобраться. Мне желательно голос без наворотов, самый лёгкий, но с возможностью подключения словаря. Скансофтовская Милена с RSUDE словарь *.bdc игнорирует. Словарь *.dat я научился создавать, ещё бы голос поставить на компьютер, который этот словарь читать будет. |
|
|
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | 19.01.14 22:44 |  |
| Не совсем в тему - на 4pda есть German Anna 1GB (для ПС и Андроида)
|
|
|
 | |
basist Гость
 | basist | :: 20.01.14 19:04 |
20.01.14 19:04 |  |
| https://cloud.mail.ru/public/44f21033cc9f/VocalizerExpressive22kHz.rar - ссылка на три русских голоса. В одном архиве вместе лежат Катя, Юра и Милена. Прямо, какая-то шведская семья... Копируете папку в C:\Program Files, регистрируете файлами реестра и радуетесь. Скажу прямо, файлы взяты с 4пда, но мук я с ними натерпелся! То, что дано там как лекарство в "ридми", совершенно никуда не годится. Названия строк, содержание их, никак не соответствуют файлам данных. Пришлось приводить одно к другому. Имена голосов, возможно, не точно отражают их значение, как задумано производителем, но для меня важно было заставить их говорить. Для х86. |
|
|
 | |
basist Гость
 | |
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | 21.01.14 2:21 |  |
| - Цитата :
- Скажу прямо, файлы взяты с 4пда, но мук я с ними натерпелся!
И у меня и других всё заработало без проблем. Это только вы у нас велико-мученник. Рад что вы разобрались самостоятельно! Выложите ваши рег файлы и ваш же readme отдельно - я их на 4пда тоже загружу, может еще кому жизнь спасут  |
|
|
 | |
al2055 Постоялец
Сообщений : 96
Репутация : 23
 | 24.01.14 12:05 |  |
| - basist пишет:
- Копируете папку в C:\Program Files, регистрируете файлами реестра и радуетесь.
Скопировал, зарегистрировал, но радости отчего-то нет. Все голоса видны, но ни в одном приложении не работают. Незарегистрированный класс, ошибка движка и т.п. |
|
|
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | |
 | |
al2055 Постоялец
Сообщений : 96
Репутация : 23
 | 24.01.14 20:15 |  |
| - apokrif пишет:
- Еще должен стоять Microsoft Visual C++ 2005 SP1 Redistributable Package (x86) 8.0.50727.762
Все это стоит и даже новее. Уже почти нашел, откуда уши торчат. |
|
|
 | |
Комсомолец2 Наблюдатель
Сообщений : 3
Репутация : 0
 | 08.02.14 19:43 |  |
| Всем доброго времени суток! Я прошу прощения если ошибся темой, но не нашел ничего более подходящего. Да не обессудят новичка модераторы. На просторах интернета я нашел следующее видео: http://www.youtube.com/watch?v=C3e7Op56qN8
Это "спич-тест", в котором участвуют три "голоса": Милена... Мария и Юля. и если с первым знаком, то последние две "дамы" - разработка наших соотечественников из ЦРТ. Что-то новенькое. Больше нигде в интернете не нашел. А тем не менее при наглядном сравнении видно, что забугорная Милена уступает как Марии так и Юле!
Я хотел бы спросить ваше мнение как понимающих в этом деле: как новенькие голоса по сравнению с Миленой на ваш счет?
P.S. Никто не сталкивался в практике с голосами "Марина" и "Юля" от ЦРТ? Их вообще реально найти? |
|
|
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | 09.02.14 16:25 |  |
| - Комсомолец2 пишет:
- Их вообще реально найти?
Это не подойдёт?
|
|
|
 | |
Комсомолец2 Наблюдатель
Сообщений : 3
Репутация : 0
 | 09.02.14 18:40 |  |
| - apokrif пишет:
- Это не подойдёт?
Да нет, именно "Марину" ищу. |
|
|
 | |
basist Гость
 | basist | :: 13.02.14 22:06 |
13.02.14 22:06 |  |
| apokrif пишет:
- Цитата :
- Выложите ваши рег файлы и ваш же readme отдельно - я их на 4пда тоже
Здесь файлы реестра, но они переделаны мной под голоса, скачанные из разных ссылок. Тут же папка Vocalizer_Expressive_SAPI5_x86_readme, которую я скачал с 4пда https://drive.google.com/folderview?id=0B7fIANHkqAlYRlh3Rm9nemhxVkk&usp=sharing Задача была установить русские голоса весом около "центнера". Сами голоса, с которыми будут работать файлы реестра, также переименованы (я не специалист в компьютерах, в школе учился тогда, когда их в помине не было, поэтому делал как умел). Мои файлы реестра будут работать с голосами, переименованными мной и загруженными на сервер для скачивания по ссылке в предыдущем сообщении. |
|
|
 | |
gammajung Наблюдатель
Сообщений : 1
Репутация : 0
 | 28.02.14 1:55 |  |
| Господа! Поставил "Милену" на XP - Premium High версию по ссылке из первого сообщения. Пишет "Ошибка синтезирования речи: класс не зарегистрирован". Что делать? Программа по восстановлению ключей реестра не работает. |
|
|
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | 13.09.14 21:57 |  |
| - gammajung пишет:
- Пишет "Ошибка синтезирования речи: класс не зарегистрирован". Что делать?
Товарищ с 4pda.ru предлагает совсем простое решение:- AlienUser пишет:
Тем, у кого не работает "Милена" Premium High на XP по ссылке из первого сообщения (Vocalizer_for_Automotive_v5) и пишет "Ошибка синтезирования речи: класс не зарегистрирован", и не помогают никакие программы по восстановлению ключей реестра (FixRegistry, speech.reg), может помочь предварительная установка KobaSpeech 2 With Vocalizer Milena - Russian.exe (из личного опыта). Я взял ее с офиц. сайта, но надеюсь, она останется бесплатной и после 30-дневного срока (на оф. сайте ничего, вроде, не видел об этом), так как это старая версия, или по крайней мере после этого срока продолжат работать голоса из Vocalizer_for_Automotive_v5. После установки KobaSpeech 2 запустите Milena.reg и SAPI5.reg (я делал именно в такой последовательности, но вы можете экспепрементировать) из набора для Vocalizer_for_Automotive_v5. Заставить так работать Милену с KobaSpeech 3 With Vocalizer Yuri - Russian.exe не получилось, но я пробовал именно с Юрием (и запускал сначала SAPI5.reg, потом - Milena.reg, хотя не знаю, какое порядок имеет значение), так как хотел послушать на пробу мужской голос, с Миленой был уже знаком по Андроиду. Чуда не произошло, - Юра - просто ужас, как все везде и пишут, с Миленой рядом не стоял. После установки KobaSpeech 2 дальше эксперементировать с 3-ей версией (с Миленой оттуда) не стал, не хотел тратить время и сомневаюсь, что разница в голосах на что-то принципиально влияет в решении указанной проблемы.
|
|
|
 | |
retigor Посетитель
Сообщений : 28
Репутация : 16
 | 25.12.14 13:36 |  |
| Качество звука новой Милены «Vocalizer Expressive»
Поставил (благодаря трудам apokrifX) на Win7 новую Милену «Vocalizer Expressive» и сравнил с её предшественницей Миленой «Vocalizer for Automotive v5», ожидал качественного прорыва! Ну думаю, и было неплохо, а с новыми возможностями, точно заткнёт за пояс и Алёну и Ольгу. Речь идёт, конечно же, об обеих версиях «Premium High».
Так вот, а что же действительно нового и качественного в «Vocalizer Expressive» ? 1. Возможность регуляции тембра (по-моему, в старой версии тембр не регулировался). 2. При этом, каких либо принципиально новых интонаций в новом голосе «экспрессивной», т.е. «выразительной» Милены, я не услышал. 3. Кроме того, в голосе появились какие-то щелчки. 4. А самое главное, звук стал более «резким», это в первую очередь связанно с тем, что разработчик увеличил громкость на верхних частотах речи, т.е. на частотах 5-6 КГц. Однако, на мой слух, новый голос Милены стал в значительной степени «металлическим». А это, как правило, бывает связанно со значительным уровнем гармонических искажений в звуке, что свидетельствует только об ухудшении качества звука.
Может я ошибаюсь? |
|
|
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | 27.12.14 20:17 |  |
| - retigor пишет:
- Может я ошибаюсь?
Ответил вам на другом форуме, просто там чаще бываю...  |
|
|
 | |
Dmitry Бывалый
Сообщений : 106
Репутация : 39
 | 30.08.15 22:38 |  |
| выложили новую милену
тут
для того что бы скачать надо регистрацию там
пока на ПК не работает, работает на андройде, надо vocalizer_e.tts_1.0.2.3r и обязательно поправьте hdr (в папке ve). для milena нужно удалить строку- Цитата :
- <COMPONENT>fe/be_adapt</COMPONENT>
в ve_pipeline_rur_milena_22_full_vssq5f22.hdr
|
|
|
 | |
alexlaw Наблюдатель
Сообщений : 4
Репутация : 1
 | 25.09.15 18:35 |  |
| Давно пользуюсь Миленой для прослушивания книг на телефоне. А сегодня сделал простую вещь:- установил Balabolka
- установил KobaSpeech 3 (ссылка выше)
- заменил папку languages в KobaSpeech 3 на папку languages из milena_full_vssq5_f22_pmk с сайта 4PDA
Все. Теперь на телефоне и на компе один голос высокого качества. |
|
|
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | |
 | |
alexlaw Наблюдатель
Сообщений : 4
Репутация : 1
 | |
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | |
 | |
alexlaw Наблюдатель
Сообщений : 4
Репутация : 1
 | |
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | |
 | |
zsoft Наблюдатель
Сообщений : 1
Репутация : 0
 | 29.11.15 5:28 |  |
| помогите не могу разобраться как под винду поставить Nuance Vocalizer Expressive... например Nuance Vocalizer for Automotive - ставится нормально и работает(в балаболке все вижу), но как я понял оно очень старое... пробую ставить Nuance Vocalizer Expressive - все делаю по инструкции, но в балаболке не появляются голоса..., в винде в панели управления > распознование речи > преобразоание текста в речь - оно появляется (разные выбрать можно: компакт, плюс, премиум) - на любой тыкаю пишет ошибку: this voice cannot be played. Please try selection another voice or selecting a different audio output device. прошу помощи... |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | |
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | 04.11.16 2:21 |  |
| - balabolka пишет:
- На сайте фирмы "Harpo"...
Да, примерно в июне выложили. Если нужно поправить 
|
|
|
 | |
alexlaw Наблюдатель
Сообщений : 4
Репутация : 1
 | 04.11.16 5:58 |  |
| 39 евро многовато будет. Т.к. для личного потребления это роскошь, а не средство "передвижения". Для себя на просторах всемирной паутины я давно нашел свою Милену для Винды не требующую за свои услуги ничего. |
|
|
 | |
balaam Интересующийся
Сообщений : 7
Репутация : 3
 | 02.01.17 21:51 |  |
| - al2055 пишет:
- Скопировал, зарегистрировал, но радости отчего-то нет. Все голоса видны, но ни в одном приложении не работают. Незарегистрированный класс, ошибка движка и т.п.
Мне, на Win 7 x64, помогло редактирование SAPI5_x86.reg. Нужно заменить в нём Program Files на Program Files (x86) Ну и сам движок распаковывал в c:\Program Files (x86)
|
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 19.09.17 17:11 |  |
| Вступил в переписку со службой поддержки компании Nuance по поводу ошибок в их голосах, обнаруженных одним из пользователей "Балаболки". Выяснилось, что все текущие голоса от фирмы Nuance содержат две проблемы.
Проблема 1. XML тег <silence/>, применяемый в SAPI 5 для добавления в речь паузы, зависит от скорости речи. Например, если указать звуковому движку сделать паузу продолжительностью 10 секунд:
<silence msec="10000"/>
то при скорости речи «0» длина паузы будет 10 секунд, при скорости речи «+5» пауза будет 7,5 секунд, при скорости речи «+10» пауза составит 5 секунд. Это очевидная ошибка в работе голоса, так как продолжительность пауз задается в миллисекундах и должна всегда оставаться неизменной (если, конечно, компьютер не движется со скоростью, близкой к скорости света).
Проблема 2. Оказалось, что при использовании голосов Nuance невозможно добавить в звуковой файл паузу продолжительностью более 66 секунд. У голосов от других фирм такого ограничения нет.
Речь идет о связке тега <silence/> и еще какого-либо текста до или после тега. И, конечно же, скорость речь и здесь оказывает свое влияние: на скорости «0» можно записать 66 секунд тишины, на скорости «+10» максимальная пауза будет 33 секунды.
---
Посмотрим, даст ли эта переписка результат. |
|
|
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | 20.09.17 14:27 |  |
| - balabolka пишет:
Вступил в переписку со службой поддержки компании Nuance по поводу ошибок в их голосах, обнаруженных одним из пользователей "Балаболки".
Здорово! Я тоже пытался связаться через разный каналы лет 5 назад – не получил ни одного ответа...
- balabolka пишет:
Проблема 1. XML тег <silence/>, применяемый в SAPI 5 для добавления в речь паузы, зависит от скорости речи.
Да, настоящий баг. Понятно, что паузы от точек, запятых, и т.д. должны зависеть от скорости речи, но не эта. Чтобы обойти, наверное можно тег <silence/> в скорость оборачивать? Понятно, что через Ж, но лучше чем ничего?
- balabolka пишет:
Проблема 2. Оказалось, что при использовании голосов Nuance невозможно добавить в звуковой файл паузу продолжительностью более 66 секунд. У голосов от других фирм такого ограничения нет.
Дык эта, скорость уменьшите до 0 и любую паузу получите!
- balabolka пишет:
Посмотрим, даст ли эта переписка результат.
Тоже интересно. А кто отвечает от Nuance - индусы или ...?
|
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 20.09.17 16:02 |  |
| apokrif Пока получил лишь вежливый ответ, что мое сообщение принято к сведению и изложенная в нем информация будет проанализирована.
Проблема с тегом <silence/> имеет значение для преобразования субтитров в звуковой файл. Пока попробую ввести поправочные коэффициенты для разных значений скорости речи для голосов Nuance (то есть, для паузы 10 секунд и скорости речи "+10" программа будет использовать значение в 20 тысяч миллисекунд для тега тишины). Но это только для субтитров.
---
Тут пришла беда, откуда не ждали: один из пользователей сообщил, что проблема с тегом тишины есть и в голосах IVONA, которые продает фирма Harpo. В доказательство своих слов он прислал файл субтитров и звуковой файл, записанный при помощи "Татьяны" на скорости "+10". В этом аудиофайле та же проблема, что и в голосах Nuance: при увеличении скорости речи длительность пауз уменьшается.
У меня самого стоит "оригинальный" голос "Татьяна", купленный еще на сайте IVONA (версия 1.6.70): в нем такой проблемы нет. Сложно поверить, что в последних версиях голоса разработчики умудрились добавить такую серьезную ошибку, но пока это выглядит именно так.
Был бы признателен, если тот, у кого стоит последняя версия "Татьяны" от фирмы Harpo, преобразовал файл субтитров в звуковой файл на скорости речи "+10", а затем проверил, совпадает речь с метками времени или нет. |
|
|
 | |
Dmitry Бывалый
Сообщений : 106
Репутация : 39
 | |
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | 21.09.17 1:00 |  |
| - balabolka пишет:
- Был бы признателен, если тот, у кого стоит последняя версия "Татьяны" от фирмы Harpo, преобразовал файл субтитров в звуковой файл на скорости речи "+10", а затем проверил, совпадает речь с метками времени или нет.
Может просто текст кинуть в SAPI, типа: <speed=1/>Сейчас будет пауза 5 сек.<silence=5000/>пауза закончилась. Сам бы сделал, но я в разметке SAPI ни бум бум...
|
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 21.09.17 15:04 |  |
| Спасибо всем тем, кто откликнулся на мою просьбу и прислал результаты тестов голосов IVONA от фирмы Harpo. Мне тоже удалось протестировать эти голоса.
Подтвердились худшие опасения: текущая версия голосов IVONA с сайта Harpo неправильно обрабатывает тег <silence/>, если скорость речи отличается от значения "0". Продолжительность тишины зависит от скорости речи, хотя величина задана в миллисекундах. В старой версии "Татьяны" (которая продавалась через сайт IVONA) всё работает нормально.
Подготовил текстовый пример и два звуковых файла, записанных с помощью новой и старой версий; отправлю их в службу поддержки Harpo. Пусть или разбираются сами, или пересылают в службу поддержки IVONA.
Подытожу:- Если кто-то собирается использовать "Балаболку" и голоса IVONA для преобразования субтитров, то берите старую версию голоса "Татьяна" (версия 1.6.70, файл Ivona_Voice_1.6_Tatyana_22kHz.exe). Либо записывайте субтитры только на скорости речи "0".
- С голосами Nuance всё плохо; в нынешнем варианте их использовать для преобразования субтитров нельзя.
- При использовании "Ольги" продолжительность тишины зависит от скорости речи.
- Голос "Алёна" работает без проблем.
|
|
|
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | |
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 24.09.17 13:35 |  |
| apokrif Тег <rate/> не помогает. |
|
|
 | |
apokrif V.I.P.
Сообщений : 331
Репутация : 85
 | 24.09.17 15:09 |  |
| - balabolka пишет:
- apokrif
Тег <rate/> не помогает. Ясно. А зависимость от скорости речи одинаковая для IVONA и Nuance? Если скорость выставляется в самой "Балаболке", а не в тексте, может можно таги <silence msec="10000"/> на лету под текущую <rate/> подправлять? Хотя если таги самому обрабатывать, наверное можно и <rate/> тоже распознавать и учитывать... |
|
|
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 24.09.17 19:26 |  |
| apokrif Зависимость от скорости речи для голосов разных фирм разная.
В "Балаболке" коррекция будет только для голосов Nuance и только для преобразования субтитров. Для голосов IVONA ничего предпринимать не стану, так как надо распознавать версию голоса (а возможно, еще и вендора). Будем надеяться, что разработчики IVONA сами исправят ошибку в короткий срок. |
|
|
 | |
|
Nuance Milena TTS |
---|