Транскриптор

Популярный голосовой модуль, работает на SAPI-5\SAPI-4 с частотой 22 КГц , имеет хорошее качество синтезируемой речи, тембр голоса и выразительную интонацию.
Ответить
Аватара пользователя
evmir_troll-hunter
Администратор

Транскриптор

#1

Сообщение evmir_troll-hunter »

transcriptor.jpg
transcriptor.jpg (134.93 КБ) 10881 просмотр

:download: Транскриптор

:password: Для открытия файла(ов) нужен пароль
► Показать
:download: phonemes
:download: phonemes.fix

:gcopyr: muk79, evilone


Транскриптор - программа для быстрого создания фонетической транскрипции слова с учетом ударения в нужном месте. Поддерживается классический формат ударения для Аленки - заглавная буква. Программа имеет поддержку пользовательских словарей для создания собственных фонетических правил и коррекции транскрипции.

Описание словарей:
phonemes - фонетический словарь, формирующий правила разбиения слов на фонемы.

Формат правил словаря:
фонема(с ударением или без)=#транскрипция#

Код: Выделить всё

цУ=#ts u1#
цЫ=#ts 11#
цА=#ts A1#
шУ=#S u1#
Важно! Сортировка такая же как и в *.rex - правила применяются последовательно один за другим.
Для выделения только части слова для замены в правиле можно использовать теги начала и окончания слова <w></w>
<w>слово</w>
<w>#s l o1 v @</w>

Код: Выделить всё

<w>слов=<w>#s l o1 v#
<w>сло=<w>#s l o1#
ово</w>=#@ v @#</w>
во</w>=#v @#</w>

phonemes.fix - словарь замен для коррекции транскрипций

Формат правил словаря:
транскрипция1=транскрипция2

Код: Выделить всё

l Y=l' Y
l {1=l' {1
m j=m' j


Формат фонетических транскрипций

Русская текстово-речевая система от Acapela использует подмножество фонетического алфавита (Speech Assessment Methods Phonetic Alphabet) или SAMPA. Только SAMPA может использоваться в фонетических транскрипциях. Символы не указанные ниже считаются неправильными, и будут проигнорированы при их включении в лексикон.

Символы SAMPA пишутся с пробелом после каждой фонемы. Единственная кавычка « ' » после согласных, указывает на смягчение согласных. Числа «1» и «2» после гласных указывают на первостепенный и второстепенный лексический акцент (иногда называемый «word-stress».

Лексический акцент

Лексический акцент указывает уровень выступа (или акцента) слога в слове. В русском языке, некоторые слова могут различаться позицией этого лексического акцента. Например, слово замок имеет два значения, в зависимости от позиции лексического акцента в слове:

Код: Выделить всё

зАмок: /z A1 m @ k / замОк: /z V m o1 k /
Практически все слова в русском языке имеют лексический акцент даже если он не всегда различается. Следовательно, важно включать лексические метки акцента при написании фонетических транскрипций.

В фонетических транскрипциях, первичный акцент указан символом «1» непосредственно после (без пробела) акцентированной гласной. Второстепенный акцент указывается символом «2».

Код: Выделить всё

Представитель / p r’ $ t s t V v’ i1 t’ $ l’ / 
Спецпредставитель / s p e2 ts p r’ $ t s t V v’ i1 t’ $ l’ /
Символ «1» в русском языке имеет два значения: символ SAMPA для гласной /1/ (буква «ы»), и первичный лексический акцент. Символ первичного лексического акцента «1» всегда следует за символами гласной без пробела во второй позиции, и различается звуком SAMPA. Например /11/ в /v 11 t / отражает звук «ы» под первичным лексическим акцентом «1».

Горловые паузы

Горловые паузы представлены фонетическим символом (вопросительный знак), - небольшим дополнительным звуком, произведенным в горле. Часто используется, для разделения двух слов, когда второе слово начинается с напряженной гласной. Этот звук включается в транскрипцию для чистоты произношения.

Например, высказывание «ну а он» может произноситься бегло без паузы

Код: Выделить всё

/n U V o1 n/
или более ясно, с одной или двумя паузами

Код: Выделить всё

/n U? V? o1 n /
Пауза

При использовании дополнительно подключенного лексикона для запрета чтения разделительных знаков символы

Код: Выделить всё

’—¦«»"'()-/<>[\]^_`{|}~
в тексте генерируют небольшую паузу.
В фонетической транскрипции небольшую паузу генерирует только символ (подчеркивание).

Не кириллический ввод

Слова, написанные латинскими символами произносятся в соответствии с правилами American English, но с русскими звуками (как будто говорит по-русски с сильным акцентом).

Быстрый поиск омографов:
При построении транскрипций слова имеющие более одного грамматического атрибута могут иметь больше одного варианта ударения. Для быстрого поиска таких слов можно включить фильтрацию в настройках фильтра грамматических атрибутов (слова только с двумя и более грамматическими атрибутами).

Ответить

Вернуться в «Acapela-Group Alyona»