Транскриптор
Добавлено: 21 июн 2018 23:42
Транскриптор
Для открытия файла(ов) нужен пароль
► Показать
phonemes.fix
muk79, evilone
Транскриптор - программа для быстрого создания фонетической транскрипции слова с учетом ударения в нужном месте. Поддерживается классический формат ударения для Аленки - заглавная буква. Программа имеет поддержку пользовательских словарей для создания собственных фонетических правил и коррекции транскрипции.
Описание словарей:
phonemes - фонетический словарь, формирующий правила разбиения слов на фонемы.
Формат правил словаря:
фонема(с ударением или без)=#транскрипция#
Код: Выделить всё
цУ=#ts u1#
цЫ=#ts 11#
цА=#ts A1#
шУ=#S u1#
Для выделения только части слова для замены в правиле можно использовать теги начала и окончания слова <w></w>
<w>слово</w>
<w>#s l o1 v @</w>
Код: Выделить всё
<w>слов=<w>#s l o1 v#
<w>сло=<w>#s l o1#
ово</w>=#@ v @#</w>
во</w>=#v @#</w>
phonemes.fix - словарь замен для коррекции транскрипций
Формат правил словаря:
транскрипция1=транскрипция2
Код: Выделить всё
l Y=l' Y
l {1=l' {1
m j=m' j
Формат фонетических транскрипций
Русская текстово-речевая система от Acapela использует подмножество фонетического алфавита (Speech Assessment Methods Phonetic Alphabet) или SAMPA. Только SAMPA может использоваться в фонетических транскрипциях. Символы не указанные ниже считаются неправильными, и будут проигнорированы при их включении в лексикон.
Символы SAMPA пишутся с пробелом после каждой фонемы. Единственная кавычка « ' » после согласных, указывает на смягчение согласных. Числа «1» и «2» после гласных указывают на первостепенный и второстепенный лексический акцент (иногда называемый «word-stress».
Лексический акцент
Лексический акцент указывает уровень выступа (или акцента) слога в слове. В русском языке, некоторые слова могут различаться позицией этого лексического акцента. Например, слово замок имеет два значения, в зависимости от позиции лексического акцента в слове:
Код: Выделить всё
зАмок: /z A1 m @ k / замОк: /z V m o1 k /
В фонетических транскрипциях, первичный акцент указан символом «1» непосредственно после (без пробела) акцентированной гласной. Второстепенный акцент указывается символом «2».
Код: Выделить всё
Представитель / p r’ $ t s t V v’ i1 t’ $ l’ /
Спецпредставитель / s p e2 ts p r’ $ t s t V v’ i1 t’ $ l’ /
Горловые паузы
Горловые паузы представлены фонетическим символом
Код: Выделить всё
/?/
Например, высказывание «ну а он» может произноситься бегло без паузы
Код: Выделить всё
/n U V o1 n/
Код: Выделить всё
/n U? V? o1 n /
При использовании дополнительно подключенного лексикона для запрета чтения разделительных знаков символы
Код: Выделить всё
’—¦«»"'()-/<>[\]^_`{|}~
В фонетической транскрипции небольшую паузу генерирует только символ
Код: Выделить всё
/ _ /
Не кириллический ввод
Слова, написанные латинскими символами произносятся в соответствии с правилами American English, но с русскими звуками (как будто говорит по-русски с сильным акцентом).
Быстрый поиск омографов:
При построении транскрипций слова имеющие более одного грамматического атрибута могут иметь больше одного варианта ударения. Для быстрого поиска таких слов можно включить фильтрацию в настройках фильтра грамматических атрибутов (слова только с двумя и более грамматическими атрибутами).