Балаболка TTS
Модератор: balabolka
- balabolka
- V.I.P.
- tonio_k
- V.I.P.
Балаболка TTS
и как мне поменять на SAPI 4?
► Показать
- balabolka
- V.I.P.
Балаболка TTS
Да, для установки SAPI 4 надо скачать и установить spchapi.exe. Рекомендуется запускать файл с правами администратора: щелкнуть правой кнопкой на имени файла и выбрать пункт меню "Запуск от имени администратора".
Можно также установить панель управления SAPI 4 spchcpl.exe. После этого в панели управления Windows появится пункт "Speech". Пользы от него мало, он позволяет лишь посмотреть список установленных голосов SAPI 4.
- balabolka
- V.I.P.
- Lecron
- Специалист
Балаболка TTS
Разрывы вставляются не только из-за ширины экрана, но и произношение предложений нередко неравномерное по сюжету. Паузы между выводом субтитров эту неравномерность синхронизирует. В вашем примереПри конвертировании субтитров в аудиофайл каждая часть предложения читается отдельно, что может привести к запинкам в речи. Новая настройка позволит избежать таких ситуаций.
6 слов — 3.1 + 0.8 сек (седьмого июня тысяча восемьсот шестьдесятого года)
3 слова — 2 + 1.1 сек (трехмачтовое судно "Британия")
2 слова + предлог — 1.8 сек. (из порта Глазго)
Есть смысл подумать об алгоритме оценки смысла разбиения и соответственно обратного объединения. Где-то будет пауза, а где-то сольётся.
- balabolka
- V.I.P.
Балаболка TTS
Lecron
Не совсем понял, о чем идет речь. У нас есть самая первая метка времени, когда надо начать чтение предложения, только на нее и стоит ориентироваться. Идеально синхронизировать речь с текстом субтитров всё равно не удастся.
Сейчас программа объединяет две части предложения в одно, если интервал времени между концом первой части и началом второй части меньше, чем 1500 миллисекунд (значение подобрал опытным путем, просмотрев субтитры для разных фильмов). Если пауза больше, чем полторы секунды, то это две разные реплики, голос прочтет их по отдельности.
Например:
Здесь пауза между частями предложения существенная (200/201 - более двух секунд), объединение не произойдет.
Не совсем понял, о чем идет речь. У нас есть самая первая метка времени, когда надо начать чтение предложения, только на нее и стоит ориентироваться. Идеально синхронизировать речь с текстом субтитров всё равно не удастся.
Сейчас программа объединяет две части предложения в одно, если интервал времени между концом первой части и началом второй части меньше, чем 1500 миллисекунд (значение подобрал опытным путем, просмотрев субтитры для разных фильмов). Если пауза больше, чем полторы секунды, то это две разные реплики, голос прочтет их по отдельности.
Например:
Код: Выделить всё
199
00:18:22,297 --> 00:18:24,117
Обещаю научить Вас...
200
00:18:24,902 --> 00:18:27,295
обращаться с оружием так же...
201
00:18:29,899 --> 00:18:31,019
легко...
202
00:18:31,854 --> 00:18:34,824
как Вы обращаетесь с кастрюлями!
- Lecron
- Специалист
Балаболка TTS
Примерно о том, о чем вы написали ниже. Но думаю можно сделать еще лучше.
Конечно идеально синхронизировать не удастся. Главное поймать момент, когда синхронизировать "по-частям" имеет смысл. И это не только по длине паузы.
Попробуйте проанализировать время на произнесение одной буквы субтитров. Или отношение паузы к времени показа предыдущего фрагмента.
1 секунда паузы для рассуждающего вслух героя и 1 секунда для доклада с поля боя. В первом случае синхронизация нужна, во втором нет.
- АлександрЛевашов
- Прохожий
- balabolka
- V.I.P.
Балаболка TTS
Настройки для portable-версии хранятся в файле BALABOLKA.PCFG в той же папке, где и программа.
- Dimsok
- Постоялец
Балаболка TTS
Предложение к улучшению функции распознавания диалогов. Возможно ли при кодировке в wav файлы менять каналы? Левый канал для одного диалога, для следующего- правый и т.п?
- balabolka
- V.I.P.
Балаболка TTS
Идея интересная; может быть, когда-нибудь ее удастся реализовать. В SAPI 5 такой возможности нет, надо использовать внешние утилиты.
- balabolka
- V.I.P.
Балаболка TTS
Попробовал добавить такой параметр в теги для Yandex Speeshkit.
В файлах с речью обычно один канал (моно). Для использования каналов придется сохранять аудиофайлы как стерео, что увеличит их размер.
Не уверен, что это действительно полезная функция. Надо будет подумать еще.Обычный текст.{{Lang=ru-RU;alena;;;;l}}Текст в левой колонке.{{Lang=ru-RU;alena;;;;r}}Текст в правой колонке.{{Lang=}}Вновь обычный текст.
В файлах с речью обычно один канал (моно). Для использования каналов придется сохранять аудиофайлы как стерео, что увеличит их размер.
- Lecron
- Специалист
Балаболка TTS
Баланс не должен быть 100%. 20-30% достаточно для позиционирования, без сбивания с панталыку.
Нюанс в другом. Кодеки определяя целевой битрейт, если его не указал пользователь, для стерео его естественно завышают. Они же не знают, что там будет на входе. Поэтому скорее стоит говорить так: включение стерео-режима для почти моно потока, не ухудшает качество при одинаковом размере.
Если учесть, что современные алгоритмы joint-stereo очень умные, даже не представляю, как отреагируют просто на баланс. Возможно увидит реальный моно и просто поставит коэффициент а-ля replay_gain для одного из каналов.
- balabolka
- V.I.P.
Балаболка TTS
Вот вариант звукового файла, когда в одном канале 100% громкости, в другом 40%.
Возможность выбора канала (левый/правый) будет в "Балаболке" для Yandex Speechkit.{{Lang=ru-RU;alena;;;;l}}– Вы были на скачках? {{Lang=}}– с интересом спросила его графиня.
{{Lang=ru-RU;filipp;;;;r}}– Да, сударыня.
{{Lang=ru-RU;alena;;;;l}}– Тогда не можете ли вы мне сказать, {{Lang=}}– живо продолжала она, {{Lang=ru-RU;alena;;;;l}}– кому принадлежала лошадь, выигравшая приз Жокей-клуба?
{{Lang=ru-RU;filipp;;;;r}}– Не знаю, {{Lang=}}– отвечал Шато-Рено, {{Lang=ru-RU;filipp;;;;r}}– я только что задал этот самый вопрос Альберу.
- OlgaLoagSinclair
- Интересующийся
Балаболка TTS
День добрый. Скачала-установила свежую версию Балаболки (v2.15.0.778), чтобы опробовать новый сервис Naver, и обнаружила, что у меня не происходит запись файлов. Т.е. кнопка "Сохранить" ничего не запускает - и не только для этого, но и для остальных онлайн-сервисов синтеза речи. Не пойму даже - куда копать: настройки какие-то изменились? операционка блокирует?
И заодно - нет ли где-нибудь архива со старыми версиями программы? Иногда бывает полезно откатиться назад и свериться
И заодно - нет ли где-нибудь архива со старыми версиями программы? Иногда бывает полезно откатиться назад и свериться
- balabolka
- V.I.P.
- OlgaLoagSinclair
- Интересующийся
Балаболка TTS
Спасибо, действительно помогло :) (интересно - что я в первый раз потеряла?)
ЗЫ. Женский голос от Naver оказался неожиданно качественным, не ожидала. По крайней мере на небольшом тексте понравился )))
ЗЫ. Женский голос от Naver оказался неожиданно качественным, не ожидала. По крайней мере на небольшом тексте понравился )))
- Kei
- Интересующийся
Балаболка TTS
Что за ужас произошел со сворачиванием программы по значку на панели задач?
У меня отключено сворачивание программы в трей при минимизации.
При попытке развернуть программу обратно, её интерфейс либо мерцает, показывая окно с текстовой частью в небольшом размере с чёрным фоном даже со стандартной темой оформления, либо вообще не появляется.
Насколько понимаю, последнее зависит от объёма открытых файлов. Если открыта лишь одна вкладка на 22КБ, то интерфейс появляется, пусть и суменьшенным размером окна с текстом и отсутствием элементов интерфейса, на вроде вкладок с версиями SAPI и ползунков к голосам.
К сожалению, это трудно зафиксировать делая скриншоты, поэтому удалось лишь снять ещё не вышедшую из полупрозрачности и не растянувшуюся на весь экран программу. Но глаз проблему прекрасно видит. При увеличении объёма открытых файлов, программа вовсе не разворачивается. При открытии 8 файлов и кэшировании их программой, с объёмами: 22КБ, 472КБ, 1.98МБ, 1.97МБ, 438КБ, 438КБ, 1.28МБ и 877МБ (Что для моего обычного использования программы ещё достаточно мало) всё становиться куда хуже.
Теперь свернуть-развернуть программу становится невозможным. При попытке развернуть её обратно раньше, чем через 5 секунд, она просто не появляется, а при дальнейшем закликивании она возвращается уже в оконном режиме. Если свернуть программу, подождать некоторое время, пока значок активного окна переместится с Балаболки на иную программу, и только тогда кликнуть по иконке, то даже в этом случае на достаточное время появляется пустое текстовое пространство с пустым фоном и невозможностью нормального взаимодействия. Иле поле может быть не пустым, но делу это не помогает. Такая картина остается минимум на четыре секунды: Проблемы с появлением интерфейса были и раньше, но они были не существенны. При большом объёме открытых файлов, открытие панели словарей заставляло программу задуматься. Этот процесс, насколько я помню, стал куда быстрее при переезде программы с HDD на SSD, пусть и не совсем решил проблему, но это были мелочи. Была ещё проблема с остановкой зачитки, пока программа рисовала панель словаря, но мне и не нужно редактировать словарь с одновременной зачиткой какого-либо текста, так что это и поймать можно было редко. Но теперь, при сворачивании, остановка читки просто делает невозможным пользоваться программой, не получая при этом болевых ощущений.
Я, на всякий случай, при обнаружении и тестировании проблем ни один раз переустанавливал программу, в том числе ставил начисто. И в самом начале, возвращался на раннюю версию программы; может мерцание окна с текстом было ещё 751, а в 781 я его заметил лишь потому что внимательно смотрел изменилось ли что-нибудь в программе, и надо ли лезть в настройки, правя фичи как мне удобнее. Но на 751 я подобного не наблюдал.
Может у меня проблемы? Или обычно все программой пользуются со включенным сворачиванием в трей, а прекращение зачитки на секунду – это лишь особенность моего голоса/sapi4 (Мой голос на четвёрке заикаится при открытии панели словарей, а на пятом от Microsoft – нет)?
К сожалению, придется вернуться на 751, поскольку с 5 секундным разворотом и заиканием зачитки использовать программу я не могу. Но мне правда интересно, может у меня какой-то случай особый?
У меня отключено сворачивание программы в трей при минимизации.
При попытке развернуть программу обратно, её интерфейс либо мерцает, показывая окно с текстовой частью в небольшом размере с чёрным фоном даже со стандартной темой оформления, либо вообще не появляется.
Насколько понимаю, последнее зависит от объёма открытых файлов. Если открыта лишь одна вкладка на 22КБ, то интерфейс появляется, пусть и суменьшенным размером окна с текстом и отсутствием элементов интерфейса, на вроде вкладок с версиями SAPI и ползунков к голосам.
К сожалению, это трудно зафиксировать делая скриншоты, поэтому удалось лишь снять ещё не вышедшую из полупрозрачности и не растянувшуюся на весь экран программу. Но глаз проблему прекрасно видит. При увеличении объёма открытых файлов, программа вовсе не разворачивается. При открытии 8 файлов и кэшировании их программой, с объёмами: 22КБ, 472КБ, 1.98МБ, 1.97МБ, 438КБ, 438КБ, 1.28МБ и 877МБ (Что для моего обычного использования программы ещё достаточно мало) всё становиться куда хуже.
Теперь свернуть-развернуть программу становится невозможным. При попытке развернуть её обратно раньше, чем через 5 секунд, она просто не появляется, а при дальнейшем закликивании она возвращается уже в оконном режиме. Если свернуть программу, подождать некоторое время, пока значок активного окна переместится с Балаболки на иную программу, и только тогда кликнуть по иконке, то даже в этом случае на достаточное время появляется пустое текстовое пространство с пустым фоном и невозможностью нормального взаимодействия. Иле поле может быть не пустым, но делу это не помогает. Такая картина остается минимум на четыре секунды: Проблемы с появлением интерфейса были и раньше, но они были не существенны. При большом объёме открытых файлов, открытие панели словарей заставляло программу задуматься. Этот процесс, насколько я помню, стал куда быстрее при переезде программы с HDD на SSD, пусть и не совсем решил проблему, но это были мелочи. Была ещё проблема с остановкой зачитки, пока программа рисовала панель словаря, но мне и не нужно редактировать словарь с одновременной зачиткой какого-либо текста, так что это и поймать можно было редко. Но теперь, при сворачивании, остановка читки просто делает невозможным пользоваться программой, не получая при этом болевых ощущений.
Я, на всякий случай, при обнаружении и тестировании проблем ни один раз переустанавливал программу, в том числе ставил начисто. И в самом начале, возвращался на раннюю версию программы; может мерцание окна с текстом было ещё 751, а в 781 я его заметил лишь потому что внимательно смотрел изменилось ли что-нибудь в программе, и надо ли лезть в настройки, правя фичи как мне удобнее. Но на 751 я подобного не наблюдал.
Может у меня проблемы? Или обычно все программой пользуются со включенным сворачиванием в трей, а прекращение зачитки на секунду – это лишь особенность моего голоса/sapi4 (Мой голос на четвёрке заикаится при открытии панели словарей, а на пятом от Microsoft – нет)?
К сожалению, придется вернуться на 751, поскольку с 5 секундным разворотом и заиканием зачитки использовать программу я не могу. Но мне правда интересно, может у меня какой-то случай особый?
- balabolka
- V.I.P.
Балаболка TTS
Kei
Спасибо за сообщение; посмотрю, что можно сделать.
Те изменения, которые были сделаны в последних версиях программы, связаны с моими попытками реализовать полную поддержку "Snap Assist" (это "улучшенный" механизм управления окнами в Windows 10). К сожалению, если работает одно - не работает другое, и наоборот. Пытаюсь найти золотую середину, но пока безрезультатно. Буду искать решение.
Спасибо за сообщение; посмотрю, что можно сделать.
Те изменения, которые были сделаны в последних версиях программы, связаны с моими попытками реализовать полную поддержку "Snap Assist" (это "улучшенный" механизм управления окнами в Windows 10). К сожалению, если работает одно - не работает другое, и наоборот. Пытаюсь найти золотую середину, но пока безрезультатно. Буду искать решение.
- slav_o
- Прохожий
Балаболка TTS
Спасибо за такую замечательную программу!
Часто ею пользуюсь, онлайн-синтез для синтеза речи становится всё лучше.
Но, к сожалению, SpeechPro TTS, которым мне нравится больше других, перестал работать со
средины апреля, выдаёт при попытке синтеза "ошибка 404".
Можно ли что-то сделать?
Часто ею пользуюсь, онлайн-синтез для синтеза речи становится всё лучше.
Но, к сожалению, SpeechPro TTS, которым мне нравится больше других, перестал работать со
средины апреля, выдаёт при попытке синтеза "ошибка 404".
Можно ли что-то сделать?
- balabolka
- V.I.P.
Балаболка TTS
slav_o
Это коммерческий сервис: надо зарегистрироваться на сайте SpeechPro.com, чтобы получить идентификатор и токен.
Разработчики сервиса добавили "капчу" на свой сайт. Таким ненавязчивым способом они дают понять, что хотят денег за свои услуги.
Это коммерческий сервис: надо зарегистрироваться на сайте SpeechPro.com, чтобы получить идентификатор и токен.
Разработчики сервиса добавили "капчу" на свой сайт. Таким ненавязчивым способом они дают понять, что хотят денег за свои услуги.
- speech
- Обыватель
Балаболка TTS
Кстати неплохой синт, я вчера послушалДобавлена поддержка сервиса перевода Naver Papago