Страница 1 из 1
Русский голос от CereProc
Добавлено: 19 ноя 2018 15:39
balabolka
2 ноября 2018 года британская компания
CereProc объявила о выпуске бета-версии русского голоса. У голоса типичное русское женское имя
Avora. Доступен голос пока только в онлайн-демо
(на главной странице сайта, вверху).
Стоимость лицензии для одного голоса CereProc 26 фунтов стерлингов (2200 рублей). Вполне терпимо.
Нет, в самом деле: откуда они взяли имя "Avora"?! Нашел соответствие только в таджикском языке (авора = книга учёта). Имелась ввиду "Аврора"? В Нью-Йорка есть здание "Avora", но там это слово образовано из двух других (
"avenue" в значении "улица" +
"ora" в значении "золото"). Притом, что имена для других голосов CereProc выбраны вполне обычные: Джек, Кирсти, Меган, Алекс, Лаура и др.
Русский голос от CereProc
Добавлено: 20 ноя 2018 00:56
balabolka
Как пояснили в компании CereProc, голос называется Avrora, а не Avora; на сайте опечатка, которую пообещали исправить в ближайшее время. Имя было предложено российскими экспертами.
Взял на себя смелость посоветовать выбрать другое имя. Не встречал женщин с именем "Аврора"; к тому же, у нас в стране это имя ассоциируется с крейсером, а не с диснеевской принцессой.
Русский голос от CereProc
Добавлено: 21 ноя 2018 16:47
tranvask
Название уже исправили, но послушать не удалось:
"Sorry, the demo encountered an error (a problem was encountered with the live demo request)"
Русский голос от CereProc
Добавлено: 22 ноя 2018 15:35
balabolka
tranvask писал(а): ↑21 ноя 2018 16:47
"Sorry, the demo encountered an error (a problem was encountered with the live demo request)"
Сообщили, что исправили; сейчас должно работать.
Русский голос от CereProc
Добавлено: 24 дек 2018 19:54
speech
Голос, я считаю, довольно перспективный. Если они им займутся, и доведут в итоге до ума, то это будет очередной подарок. Приятный моложавый голос.
офф (таньки и катьки все-таки пожилые тетеньки на слух)
Русский голос от CereProc
Добавлено: 25 дек 2018 10:39
Fenix
Да, голос ничего так. Интересно, что у них получится в релизной версии. Если он будет ещё и звучать нормально, без этих подвываний, как в первых версиях Миленки, будет вообще хорошо. Ну и произношение английских слов позабавило. В общем, будем посмотреть...
Русский голос от CereProc
Добавлено: 11 авг 2020 15:42
balabolka
В старых версиях CereVoice папки с установленными голосами содержали текстовые файлы с правилами чтения аббревиатур и с паузами после знаков препинания. Новые версии голосов (включая текущую версию 6.0.0) содержат только один файл с расширением .VOICE: все данные хранятся внутри этого файла в собственном формате данных CereProc.
Однако, и сейчас существует возможность для пользователей редактировать список аббревиатур или изменять паузы после знаков препинания. В той папке, где лежит файл .VOICE для голоса, можно создать три текстовых файла:
- user_pbreak.txt
- user_abbreviations.txt
- user_lexicon.txt
Файл
user_pbreak.txt содержит значения пауз после и до знака препинания. Чтобы паузы не суммировались, если в тексте несколько знаков препинания стоят подряд, указаны также "уровни" важности для символов, от 0 до 4. Чем выше уровень, тем важнее этот символ. Например, если в конце предложения стоят кавычки (уровень 3) и точка (уровень 4), то голос будет использовать значение паузы после точки.
Код: Выделить всё
#punctuation symbol,
# after: break level (0-4) and break time(seconds),
# before: break level (0-4) and break time(seconds)
#bigger break level override less levels
. 4 0.400 0 0.000
! 4 0.400 0 0.000
? 4 0.400 0 0.000
, 3 0.200 0 0.000
- 3 0.200 0 0.000
( 0 0.000 3 0.300
) 3 0.300 0 0.000
[ 0 0.000 3 0.300
] 3 0.200 0 0.000
; 3 0.300 0 0.000
: 3 0.300 0 0.000
" 3 0.300 3 0.300
#special case requires opening ' in norm buffer for closing to fire
' 3 0.300 3 0.300
Файл
user_abbreviations.txt содержит правила чтения аббревиатур и сокращений. Каждая строка содержит
аббревиатуру,
флаг признака окончания предложения и
текст замены для аббревиатуры или сокращения. Флаг признака
(no break flag) нужен для тех случаев, когда после сокращения стоит знак препинания; например,
Dr. Johnson (голос не будет обрабатывать точку после сокращения как конец предложения).
Код: Выделить всё
3G 0 three g
7/11 0 seven eleven
Dr 1 doctor
FAQ 0 f a:letter q
В файле
user_lexicon.txt на каждой строке находятся правила чтения слов:
слово и его
фонетическая транскрипция. Слово должно быть записано маленькими буквами и содержать только буквы (если "слово" содержит какие-либо еще символы, его необходимо перенести в файл аббревиатур). Ударение указывается с помощью цифр 1 (первичное ударение в слове), 2 (вторичное ударение) и 0 (нет ударения). Если требуется использовать буквы, которые отсутствуют в латинском алфавите, кодировка файла должна быть UTF-8. Списки фонем для разных языков можно посмотреть
здесь (списка для русского языка нет).
Архив содержит примеры файлов для английского языка. Для разных языков значения пауз после знаков препинания будут отличаться. Списки аббревиатур и сокращений, а также лексиконы, разумеется, тоже будут разными. Файлы должны лежать в той же папке, где и файл голоса.
Русский голос от CereProc
Добавлено: 15 авг 2020 01:28
balabolka
О ситуации с русским голосом "Avrora". Windows-версия для SAPI5 до сих пор не вышла, и неизвестно, когда это произойдет. "Avrora" доступна как онлайн-сервис; для работы с ним надо зарегистрироваться на
сайте.
После регистрации выдают 10000 "кредитов". 1 кредит = озвучка 1 символа. Синтезировать речь можно как с помощью
API, так и в личном кабинете на сайте, но "халявные" 10000 кредитов можно потратить только для запросов с помощью API. Пополнить счет можно
здесь: миллион кредитов
(то есть озвучка примерно мегабайта текста) за $18.
Голос озвучивает обычный текст или SSML. В тексте запросов можно переключаться между голосами с помощью тегов:
Код: Выделить всё
Hello. My name is Stuart. This is my CereProc sister, Heather.
<voice name='Heather'>Hello, my name is Heather.</voice>
Можно использовать собственные теги CereProc для различных неречевых действий (кашель, запинки, вздохи и т.д.).
Код: Выделить всё
<spurt audio="g0001_004">cough</spurt>, excuse me, <spurt audio="g0001_018">err</spurt>, hello.
Также, есть теги для эмоциональной окраски речи (доступны не во всех голосах).
Код: Выделить всё
Today, <voice emotion='happy'>the sun is shining.</voice>
Русский голос от CereProc
Добавлено: 15 авг 2020 08:24
speech
balabolka писал(а): ↑15 авг 2020 01:28
"Avrora". Windows-версия для SAPI5 до сих пор не вышла, и неизвестно, когда это произойдет.
Их голос и правда под большим и жирным вопросом - в письме они ответили, что оффлайна не будет.
А так посмотрим, рынок вещь не линейная.
Русский голос от CereProc
Добавлено: 17 авг 2020 23:53
ПетрФомин
speech писал(а): ↑15 авг 2020 08:24
Их голос и правда под большим и жирным вопросом - в письме они ответили, что оффлайна не будет.
Тогда чего мы тут все собрались. Если она только онлайн то всёравно до гугл вейв-нета ей далеко. Жаль а я так надеялся что появится первый вменяемый TTS движок по винду.
Русский голос от CereProc
Добавлено: 24 авг 2020 13:50
Fenix
Собрались по тому, что даже если качество не самое-самое, интерес присутствует в любом случае, да и от разнообразия вреда мало. Вообще, как мне кажется, на появление коммерческих офлайновых движков надеяться особо не стоит. Важность десктопа для обычных пользователей сильно упала, а следовательно и интерес компаний угас. Единственное направление, откуда может подуть свежий ветерок, это Accessibility.