TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  ПользователиПользователи  ГруппыГруппы   Статистика  Список рапортов  ПрофильПрофиль  Сообщения ЛССообщения ЛС  Выход [ evmir_troll-hunter ]Выход [ evmir_troll-hunter ]  



Начать новую темуОтветить на тему

Фонемный цифровой синтез

Предыдущая тема Следующая тема Перейти вниз
АвторСообщениеФонемный цифровой синтез
mia
V.I.P.
avatar


Сообщений : 184
Репутация : 7

 mia :: 21.02.09 10:34
21.02.09 10:34
Выбрать/отменить одновременное цитирование Ответить с цитатой Редактировать сообщение Удалить сообщение Послать сигнальный рапорт на это сообщение администратору или модератору Закрыть рапорты на это сообщение

Спасибо/Thanks
Фонемный цифровой синтез

Широкое распространение в настоящее время получил фонемный цифровой синтез, основанный на генерации фонем и дальнейшей компиляции из них слов и фраз. Этот подход сочетает компактность цифровых методов обработки с гибкостью управления основными параметрами речи, что свойственно формантным моделям. Процесс кодирования необходимого словаря здесь заменен компиляцией произвольных сообщений из набора заранее закодированных элементов речи.

Фонемный цифровой синтезатор (рис. 8.13) содержит три уровня обработки [22]. На первом уровне происходит перекодировка последовательности орфографических символов, представленных в закодированном виде в последовательность кодов фонем; на втором рассчитывается набор акустических параметров, который служит для управления третьим уровнем - формированием выходного речевого сигнала. Текст преобразуется в фонемную форму двумя способами: 1) если входное слово имеется в словаре системы, то оно однозначно переводится в последовательность фонем; 2) если же слово отсутствует в словаре, то производится преобразование по правилам. Поскольку все правила имеют исключения, а исключения по существу, требуют собственных словарей, то преобразования по правилам могут дать ошибку в произношении. Поэтому в словарь вносятся сокращения и ходовые иностранные слова.

На втором уровне обработки вычисляется набор управляющих параметров. Этими параметрами являются формантные частоты (F1,F2,F3)и полосы (deltaF1,deltaF2,deltaF3), частота основного тона и амплитуда вокализации. Набор параметров обновляется каждые 6,4 мс. Такой интервал позволяет хорошо отслеживать самые быстрые переходы между фонемами.

Скорость передачи информации от второго уровня к третьему составляет 45 тыс.бит/с.

Синтез речи осуществляется на третьей стадии. Сигналы возбуждения (гармонический и шумовой) фильтруются формантными резонансными фильтрами голосового тракта.

Частота выборок сигнала равна 10 кГц, что позволяет передавать частотные составляющие до 5 кГц. Структура данного синтезатора реализована на цифровом процессоре сигналов TMS 32010 фирмы «Техас инструментс».


Рис. 8.13 - Структурная схема цифрового фонемного синтезатора

Вернуться к началу Перейти вниз
Посмотреть профильОтправить личное сообщение

Фонемный цифровой синтез

Предыдущая тема Следующая тема Вернуться к началу
Фонемный цифровой синтез
Страница 1 из 1Страница 1 из 1
  Следить за ответами в теме    Форма быстрого ответа    Следить за ответами в теме    Форма быстрого ответа  
Начать новую темуОтветить на темуПерейти:

Удалить тему Отправить в корзину  Перенести тему  Закрыть тему  Разделить тему Объединить темы 
Инструменты для модерации
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении