Русский голос от CereProc
- balabolka
- V.I.P.
Русский голос от CereProc
2 ноября 2018 года британская компания CereProc объявила о выпуске бета-версии русского голоса. У голоса типичное русское женское имя Avora. Доступен голос пока только в онлайн-демо (на главной странице сайта, вверху).
Стоимость лицензии для одного голоса CereProc 26 фунтов стерлингов (2200 рублей). Вполне терпимо.
Нет, в самом деле: откуда они взяли имя "Avora"?! Нашел соответствие только в таджикском языке (авора = книга учёта). Имелась ввиду "Аврора"? В Нью-Йорка есть здание "Avora", но там это слово образовано из двух других ("avenue" в значении "улица" + "ora" в значении "золото"). Притом, что имена для других голосов CereProc выбраны вполне обычные: Джек, Кирсти, Меган, Алекс, Лаура и др.
Стоимость лицензии для одного голоса CereProc 26 фунтов стерлингов (2200 рублей). Вполне терпимо.
Нет, в самом деле: откуда они взяли имя "Avora"?! Нашел соответствие только в таджикском языке (авора = книга учёта). Имелась ввиду "Аврора"? В Нью-Йорка есть здание "Avora", но там это слово образовано из двух других ("avenue" в значении "улица" + "ora" в значении "золото"). Притом, что имена для других голосов CereProc выбраны вполне обычные: Джек, Кирсти, Меган, Алекс, Лаура и др.
- balabolka
- V.I.P.
Русский голос от CereProc
Как пояснили в компании CereProc, голос называется Avrora, а не Avora; на сайте опечатка, которую пообещали исправить в ближайшее время. Имя было предложено российскими экспертами.
Взял на себя смелость посоветовать выбрать другое имя. Не встречал женщин с именем "Аврора"; к тому же, у нас в стране это имя ассоциируется с крейсером, а не с диснеевской принцессой.
Взял на себя смелость посоветовать выбрать другое имя. Не встречал женщин с именем "Аврора"; к тому же, у нас в стране это имя ассоциируется с крейсером, а не с диснеевской принцессой.
- tranvask
- Прохожий
Русский голос от CereProc
Название уже исправили, но послушать не удалось:
"Sorry, the demo encountered an error (a problem was encountered with the live demo request)"
"Sorry, the demo encountered an error (a problem was encountered with the live demo request)"
- balabolka
- V.I.P.
- speech
- Обыватель
Русский голос от CereProc
Голос, я считаю, довольно перспективный. Если они им займутся, и доведут в итоге до ума, то это будет очередной подарок. Приятный моложавый голос.
офф (таньки и катьки все-таки пожилые тетеньки на слух)
офф (таньки и катьки все-таки пожилые тетеньки на слух)
- Fenix
- Администратор
Русский голос от CereProc
Да, голос ничего так. Интересно, что у них получится в релизной версии. Если он будет ещё и звучать нормально, без этих подвываний, как в первых версиях Миленки, будет вообще хорошо. Ну и произношение английских слов позабавило. В общем, будем посмотреть...
- balabolka
- V.I.P.
Русский голос от CereProc
В старых версиях CereVoice папки с установленными голосами содержали текстовые файлы с правилами чтения аббревиатур и с паузами после знаков препинания. Новые версии голосов (включая текущую версию 6.0.0) содержат только один файл с расширением .VOICE: все данные хранятся внутри этого файла в собственном формате данных CereProc.
Однако, и сейчас существует возможность для пользователей редактировать список аббревиатур или изменять паузы после знаков препинания. В той папке, где лежит файл .VOICE для голоса, можно создать три текстовых файла:
Файл user_abbreviations.txt содержит правила чтения аббревиатур и сокращений. Каждая строка содержит аббревиатуру, флаг признака окончания предложения и текст замены для аббревиатуры или сокращения. Флаг признака (no break flag) нужен для тех случаев, когда после сокращения стоит знак препинания; например, Dr. Johnson (голос не будет обрабатывать точку после сокращения как конец предложения).
В файле user_lexicon.txt на каждой строке находятся правила чтения слов: слово и его фонетическая транскрипция. Слово должно быть записано маленькими буквами и содержать только буквы (если "слово" содержит какие-либо еще символы, его необходимо перенести в файл аббревиатур). Ударение указывается с помощью цифр 1 (первичное ударение в слове), 2 (вторичное ударение) и 0 (нет ударения). Если требуется использовать буквы, которые отсутствуют в латинском алфавите, кодировка файла должна быть UTF-8. Списки фонем для разных языков можно посмотреть здесь (списка для русского языка нет).
Архив содержит примеры файлов для английского языка. Для разных языков значения пауз после знаков препинания будут отличаться. Списки аббревиатур и сокращений, а также лексиконы, разумеется, тоже будут разными. Файлы должны лежать в той же папке, где и файл голоса.
Однако, и сейчас существует возможность для пользователей редактировать список аббревиатур или изменять паузы после знаков препинания. В той папке, где лежит файл .VOICE для голоса, можно создать три текстовых файла:
- user_pbreak.txt
- user_abbreviations.txt
- user_lexicon.txt
Код: Выделить всё
#punctuation symbol,
# after: break level (0-4) and break time(seconds),
# before: break level (0-4) and break time(seconds)
#bigger break level override less levels
. 4 0.400 0 0.000
! 4 0.400 0 0.000
? 4 0.400 0 0.000
, 3 0.200 0 0.000
- 3 0.200 0 0.000
( 0 0.000 3 0.300
) 3 0.300 0 0.000
[ 0 0.000 3 0.300
] 3 0.200 0 0.000
; 3 0.300 0 0.000
: 3 0.300 0 0.000
" 3 0.300 3 0.300
#special case requires opening ' in norm buffer for closing to fire
' 3 0.300 3 0.300
Код: Выделить всё
3G 0 three g
7/11 0 seven eleven
Dr 1 doctor
FAQ 0 f a:letter q
Код: Выделить всё
mourinho m_@@0_r_ii1_n_y_ou2
- Вложения
-
- user_files_cerevoice.zip
- (950 байт) 132 скачивания
- balabolka
- V.I.P.
Русский голос от CereProc
О ситуации с русским голосом "Avrora". Windows-версия для SAPI5 до сих пор не вышла, и неизвестно, когда это произойдет. "Avrora" доступна как онлайн-сервис; для работы с ним надо зарегистрироваться на сайте.
После регистрации выдают 10000 "кредитов". 1 кредит = озвучка 1 символа. Синтезировать речь можно как с помощью API, так и в личном кабинете на сайте, но "халявные" 10000 кредитов можно потратить только для запросов с помощью API. Пополнить счет можно здесь: миллион кредитов (то есть озвучка примерно мегабайта текста) за $18.
Голос озвучивает обычный текст или SSML. В тексте запросов можно переключаться между голосами с помощью тегов:
Можно использовать собственные теги CereProc для различных неречевых действий (кашель, запинки, вздохи и т.д.).
Также, есть теги для эмоциональной окраски речи (доступны не во всех голосах).
После регистрации выдают 10000 "кредитов". 1 кредит = озвучка 1 символа. Синтезировать речь можно как с помощью API, так и в личном кабинете на сайте, но "халявные" 10000 кредитов можно потратить только для запросов с помощью API. Пополнить счет можно здесь: миллион кредитов (то есть озвучка примерно мегабайта текста) за $18.
Голос озвучивает обычный текст или SSML. В тексте запросов можно переключаться между голосами с помощью тегов:
Код: Выделить всё
Hello. My name is Stuart. This is my CereProc sister, Heather.
<voice name='Heather'>Hello, my name is Heather.</voice>
Код: Выделить всё
<spurt audio="g0001_004">cough</spurt>, excuse me, <spurt audio="g0001_018">err</spurt>, hello.
Код: Выделить всё
Today, <voice emotion='happy'>the sun is shining.</voice>
- speech
- Обыватель
Русский голос от CereProc
Их голос и правда под большим и жирным вопросом - в письме они ответили, что оффлайна не будет.
А так посмотрим, рынок вещь не линейная.
- ПетрФомин
- Интересующийся
Русский голос от CereProc
Тогда чего мы тут все собрались. Если она только онлайн то всёравно до гугл вейв-нета ей далеко. Жаль а я так надеялся что появится первый вменяемый TTS движок по винду.
- Fenix
- Администратор
Русский голос от CereProc
Собрались по тому, что даже если качество не самое-самое, интерес присутствует в любом случае, да и от разнообразия вреда мало. Вообще, как мне кажется, на появление коммерческих офлайновых движков надеяться особо не стоит. Важность десктопа для обычных пользователей сильно упала, а следовательно и интерес компаний угас. Единственное направление, откуда может подуть свежий ветерок, это Accessibility.