Русский голос от CereProc

Ответить
Аватара пользователя
balabolka
V.I.P.

Русский голос от CereProc

#1

Сообщение balabolka »

2 ноября 2018 года британская компания CereProc объявила о выпуске бета-версии русского голоса. У голоса типичное русское женское имя Avora. Доступен голос пока только в онлайн-демо (на главной странице сайта, вверху).

Стоимость лицензии для одного голоса CereProc 26 фунтов стерлингов (2200 рублей). Вполне терпимо.
Нет, в самом деле: откуда они взяли имя "Avora"?! Нашел соответствие только в таджикском языке (авора = книга учёта). Имелась ввиду "Аврора"? В Нью-Йорка есть здание "Avora", но там это слово образовано из двух других ("avenue" в значении "улица" + "ora" в значении "золото"). Притом, что имена для других голосов CereProc выбраны вполне обычные: Джек, Кирсти, Меган, Алекс, Лаура и др. :suspect:

Аватара пользователя
balabolka
V.I.P.

Русский голос от CereProc

#2

Сообщение balabolka »

Как пояснили в компании CereProc, голос называется Avrora, а не Avora; на сайте опечатка, которую пообещали исправить в ближайшее время. Имя было предложено российскими экспертами.

Взял на себя смелость посоветовать выбрать другое имя. Не встречал женщин с именем "Аврора"; к тому же, у нас в стране это имя ассоциируется с крейсером, а не с диснеевской принцессой.

Аватара пользователя
tranvask
Прохожий

Русский голос от CereProc

#3

Сообщение tranvask »

Название уже исправили, но послушать не удалось:
"Sorry, the demo encountered an error (a problem was encountered with the live demo request)"

Аватара пользователя
balabolka
V.I.P.

Русский голос от CereProc

#4

Сообщение balabolka »

tranvask писал(а):
21 ноя 2018 16:47
"Sorry, the demo encountered an error (a problem was encountered with the live demo request)"
Сообщили, что исправили; сейчас должно работать.

Аватара пользователя
speech
Обыватель

Русский голос от CereProc

#5

Сообщение speech »

Голос, я считаю, довольно перспективный. Если они им займутся, и доведут в итоге до ума, то это будет очередной подарок. Приятный моложавый голос.
офф (таньки и катьки все-таки пожилые тетеньки на слух)

Аватара пользователя
Fenix
Администратор

Русский голос от CereProc

#6

Сообщение Fenix »

Да, голос ничего так. Интересно, что у них получится в релизной версии. Если он будет ещё и звучать нормально, без этих подвываний, как в первых версиях Миленки, будет вообще хорошо. Ну и произношение английских слов позабавило. В общем, будем посмотреть...

Аватара пользователя
balabolka
V.I.P.

Русский голос от CereProc

#7

Сообщение balabolka »

В старых версиях CereVoice папки с установленными голосами содержали текстовые файлы с правилами чтения аббревиатур и с паузами после знаков препинания. Новые версии голосов (включая текущую версию 6.0.0) содержат только один файл с расширением .VOICE: все данные хранятся внутри этого файла в собственном формате данных CereProc.

Однако, и сейчас существует возможность для пользователей редактировать список аббревиатур или изменять паузы после знаков препинания. В той папке, где лежит файл .VOICE для голоса, можно создать три текстовых файла:
  • user_pbreak.txt
  • user_abbreviations.txt
  • user_lexicon.txt
Файл user_pbreak.txt содержит значения пауз после и до знака препинания. Чтобы паузы не суммировались, если в тексте несколько знаков препинания стоят подряд, указаны также "уровни" важности для символов, от 0 до 4. Чем выше уровень, тем важнее этот символ. Например, если в конце предложения стоят кавычки (уровень 3) и точка (уровень 4), то голос будет использовать значение паузы после точки.

Код: Выделить всё

#punctuation symbol, 
# after: break level (0-4) and break time(seconds), 
# before:  break level (0-4) and break time(seconds)
#bigger break level override less levels
.	4     0.400 0	     0.000
!	4     0.400 0	     0.000
?	4     0.400 0	     0.000
,	3     0.200 0	     0.000
-	3     0.200 0	     0.000
(	0     0.000 3	     0.300
)	3     0.300 0	     0.000
[	0     0.000 3	     0.300
]	3     0.200 0	     0.000
;	3     0.300 0	     0.000
:	3     0.300 0	     0.000
"	3     0.300 3	     0.300
#special case requires opening ' in norm buffer for closing to fire
'	3     0.300 3	     0.300
Файл user_abbreviations.txt содержит правила чтения аббревиатур и сокращений. Каждая строка содержит аббревиатуру, флаг признака окончания предложения и текст замены для аббревиатуры или сокращения. Флаг признака (no break flag) нужен для тех случаев, когда после сокращения стоит знак препинания; например, Dr. Johnson (голос не будет обрабатывать точку после сокращения как конец предложения).

Код: Выделить всё

3G	0	three g
7/11	0	seven eleven
Dr	1	doctor
FAQ	0	f a:letter q
В файле user_lexicon.txt на каждой строке находятся правила чтения слов: слово и его фонетическая транскрипция. Слово должно быть записано маленькими буквами и содержать только буквы (если "слово" содержит какие-либо еще символы, его необходимо перенести в файл аббревиатур). Ударение указывается с помощью цифр 1 (первичное ударение в слове), 2 (вторичное ударение) и 0 (нет ударения). Если требуется использовать буквы, которые отсутствуют в латинском алфавите, кодировка файла должна быть UTF-8. Списки фонем для разных языков можно посмотреть здесь (списка для русского языка нет).

Код: Выделить всё

mourinho	m_@@0_r_ii1_n_y_ou2
Архив содержит примеры файлов для английского языка. Для разных языков значения пауз после знаков препинания будут отличаться. Списки аббревиатур и сокращений, а также лексиконы, разумеется, тоже будут разными. Файлы должны лежать в той же папке, где и файл голоса.
Вложения
user_files_cerevoice.zip
(950 байт) 132 скачивания

Аватара пользователя
balabolka
V.I.P.

Русский голос от CereProc

#8

Сообщение balabolka »

О ситуации с русским голосом "Avrora". Windows-версия для SAPI5 до сих пор не вышла, и неизвестно, когда это произойдет. "Avrora" доступна как онлайн-сервис; для работы с ним надо зарегистрироваться на сайте.

После регистрации выдают 10000 "кредитов". 1 кредит = озвучка 1 символа. Синтезировать речь можно как с помощью API, так и в личном кабинете на сайте, но "халявные" 10000 кредитов можно потратить только для запросов с помощью API. Пополнить счет можно здесь: миллион кредитов (то есть озвучка примерно мегабайта текста) за $18.

Голос озвучивает обычный текст или SSML. В тексте запросов можно переключаться между голосами с помощью тегов:

Код: Выделить всё

Hello. My name is Stuart. This is my CereProc sister, Heather.
<voice name='Heather'>Hello, my name is Heather.</voice>
Можно использовать собственные теги CereProc для различных неречевых действий (кашель, запинки, вздохи и т.д.).

Код: Выделить всё

<spurt audio="g0001_004">cough</spurt>, excuse me, <spurt audio="g0001_018">err</spurt>, hello.
Также, есть теги для эмоциональной окраски речи (доступны не во всех голосах).

Код: Выделить всё

Today, <voice emotion='happy'>the sun is shining.</voice>

Аватара пользователя
speech
Обыватель

Русский голос от CereProc

#9

Сообщение speech »

balabolka писал(а):
15 авг 2020 01:28
"Avrora". Windows-версия для SAPI5 до сих пор не вышла, и неизвестно, когда это произойдет.
Их голос и правда под большим и жирным вопросом - в письме они ответили, что оффлайна не будет.
А так посмотрим, рынок вещь не линейная.

Аватара пользователя
ПетрФомин
Интересующийся

Русский голос от CereProc

#10

Сообщение ПетрФомин »

speech писал(а):
15 авг 2020 08:24
Их голос и правда под большим и жирным вопросом - в письме они ответили, что оффлайна не будет.
Тогда чего мы тут все собрались. Если она только онлайн то всёравно до гугл вейв-нета ей далеко. Жаль а я так надеялся что появится первый вменяемый TTS движок по винду.

Аватара пользователя
Fenix
Администратор

Русский голос от CereProc

#11

Сообщение Fenix »

Собрались по тому, что даже если качество не самое-самое, интерес присутствует в любом случае, да и от разнообразия вреда мало. Вообще, как мне кажется, на появление коммерческих офлайновых движков надеяться особо не стоит. Важность десктопа для обычных пользователей сильно упала, а следовательно и интерес компаний угас. Единственное направление, откуда может подуть свежий ветерок, это Accessibility.

Ответить

Вернуться в «Сведения, обсуждения»