Балаболка TTS
Модератор: balabolka
- GIS88
- Обыватель
Балаболка TTS
Пожалуйста подскажите как перенести настройки из этой версии viewtopic.php?f=42&t=49#top в новую? Папку dictionaries я сам догадался перенести.
- balabolka
- V.I.P.
Балаболка TTS
GIS88
Portable-версия "Балаболки" хранит настройки в файле balabolka.pcfg в той же папке, где и программа.
Portable-версия "Балаболки" хранит настройки в файле balabolka.pcfg в той же папке, где и программа.
- fich
- Обыватель
Балаболка TTS
Продублирую свой вопрос, -Есть ли у кого опыт с планшетами имеющими Винду(а не убогое андро-иос) - устанавливается ли в неё Звук движек "Николай" и естесно Балаболка и всё это "читает" вслух . .. Посто, Николай у меня грамотен настолько что в одном стакан.. планшете - Винда + Балаболка + Николая(возмога дополнять словарь Балаболки) + туева хуча ТХТ -был бы Шикарный, вечный(по меркам кетацких сроков годности) -БУК-плеер!
- tonio_k
- V.I.P.
Балаболка TTS
IVONA Максим/Татьяна для Андроида есть (планшет смартфон). Установил на смартфон - и только текстовые файлы ему кидай. Словари и их обновление есть на форуме 4pda. Это альтернативное направление Балаболке так как рассчитано на Андроид.
Есть и другие голоса. Но Николая там нет.
- Lecron
- Специалист
Балаболка TTS
Конкретно Николай — не знаю. SAPI5 устанавливаются на раз-два. В частности Loquendo Olga, правда был небольшой затык с активацией. Вот только управлять на небольшом 10" сенсорном экране оказалось не так удобно. Особенно редактор ударений. В итоге, продолжил делать книги на 4-ядерном десктопе и прозрачно кидать на "плеер" через синхронизацию Syncting.
А на всякий случай, если вдруг поток поступления прервется)), на андроид-смарте стоит VocalizerEx2 (вроде тот самый IVONA). Что заметил, автономность генерации вдвое ниже прослушивания готового. Плюс, при прослушивании, выше общее удобство. Вские таймеры сна, авто-запоминание позиции, отображение обложки, перемотка по времени (настроено 20 сек и 2 мин) и по главам (файлам), управление с кнопок без включения экрана, индикаторы продолжительности в минуто-часах, а не примерное положение полосы прокрутки.
Кстати, удобство управления легко проверить на любом планшете. Организуйте удаленный доступ к своему десктопу. Для большей аутентичности Microsoft RD client или для простоты TeamViewer и попробуйте попользовать.
- Kei
- Интересующийся
Балаболка TTS
У меня проблема с L&H tts 3000. При первом запуске всё работает отлично, при повторном же голоса пропадают и уже не возвращаются. Возвращает их только переустановка программы. В Portable-версии их нету изначально.
Она возникает всегда, вне зависимости от компьютера и версии программы. В Говорилке, например, подобный проблемы ни разу не возникло.
Собственно, можно ли что-то с этим сделать, и в чем может крыться проблема?
Она возникает всегда, вне зависимости от компьютера и версии программы. В Говорилке, например, подобный проблемы ни разу не возникло.
Собственно, можно ли что-то с этим сделать, и в чем может крыться проблема?
- balabolka
- V.I.P.
Балаболка TTS
Kei
Возможно, проблема в "Контроле учетных записей" (UAC) в Windows 10. Он может блокировать доступ к функциям SAPI 4. Если у программы нет доступа к SAPI 4, она не сможет даже получить список голосов.
Можно попробовать запускать программу от имени администратора. Или можно в "Свойствах" файла задать режим совместимости (вкладка "Совместимость"). Отключить UAC советовать не буду, это снизит защиту вашего компьютера.
В любом случае, надо помнить, что SAPI 4 - это устаревший набор функций, и Microsoft не гарантирует его стабильную работу на новых версиях Windows. Нас принуждают переходить на использование голосов SAPI 5.
Возможно, проблема в "Контроле учетных записей" (UAC) в Windows 10. Он может блокировать доступ к функциям SAPI 4. Если у программы нет доступа к SAPI 4, она не сможет даже получить список голосов.
Можно попробовать запускать программу от имени администратора. Или можно в "Свойствах" файла задать режим совместимости (вкладка "Совместимость"). Отключить UAC советовать не буду, это снизит защиту вашего компьютера.
В любом случае, надо помнить, что SAPI 4 - это устаревший набор функций, и Microsoft не гарантирует его стабильную работу на новых версиях Windows. Нас принуждают переходить на использование голосов SAPI 5.
- fich
- Обыватель
Балаболка TTS
Всё что на андре -убого и коряво, поюзал и забыл как страшный,неудобный сон. И ждать-просить когда мне кто-то словарь обновит, не привык.tonio_k
IVONA Максим/Татьяна для Андроида есть (планшет смартфон). Установил на смартфон - и только текстовые файлы ему кидай. Словари и их обновление есть ...
- Меня интересует БАЛАБОЛКА+НИКОЛАЙ (т.к. это может быть только на Винде. то и ПЛАНШЕТ С ВИНДОЙ) и отзывы.
Lecron - какая у ас модель планшета и что за винда. Николай на САПИ5 встаёт и Активация не нужна.
- Kei
- Интересующийся
Балаболка TTS
У меня вопрос – Балаболка как-то сама регулирует паузу после конца абзаца/предложения? С нулями в параметрах во вкладки “Паузы”.
Заметив увеличение длинны паузы (В сравнении с работой в Говорилке), я замерил продолжительность одного фрагмента при его чтении в Балаболке и Говорилке.
Балаболка – 1:43
Говорилка – 1:21
После удаления точек, восклицательных и вопросительных знаков получил этот результат:
Балаболка - 1:29
Говорилка - 1:21
А после удаления абзацев этот:
Балаболка - 1:24
Говорилка - 1:24
Я бы списал это на ещё один разлад этого голоса с программой, но в “Коррекция произношения – Добавить правило – Тестирование произношение”, увеличенной паузы нету и всё работает привычно.
Вообще это мелочь, увеличивающая продолжительность в среднем на 1.1–1.2. Но с оригинальной работать более удобно – 100 Кб/20 000 Слов/ 33.3 Стр. практически нацело конвертируются в один час.
Скорее всего с этим не получится ничего сделать, но всё же: можно ли регулировать их длительность в сторону уменьшения?
Заметив увеличение длинны паузы (В сравнении с работой в Говорилке), я замерил продолжительность одного фрагмента при его чтении в Балаболке и Говорилке.
Балаболка – 1:43
Говорилка – 1:21
После удаления точек, восклицательных и вопросительных знаков получил этот результат:
Балаболка - 1:29
Говорилка - 1:21
А после удаления абзацев этот:
Балаболка - 1:24
Говорилка - 1:24
Я бы списал это на ещё один разлад этого голоса с программой, но в “Коррекция произношения – Добавить правило – Тестирование произношение”, увеличенной паузы нету и всё работает привычно.
Вообще это мелочь, увеличивающая продолжительность в среднем на 1.1–1.2. Но с оригинальной работать более удобно – 100 Кб/20 000 Слов/ 33.3 Стр. практически нацело конвертируются в один час.
Скорее всего с этим не получится ничего сделать, но всё же: можно ли регулировать их длительность в сторону уменьшения?
- wasyaka
- V.I.P.
Балаболка TTS
ctrl+Alt+j окно выскакивает почти на всю ширину монитора, окно редактора словарей в цетр монитора.
Сама прога запоминает расположение рабочего окна при закрытии, а окна словарей постоянно приходится править при старте, - запомнить конфигурацию окна словарей??
или привязать к рабочему окну - не выходило за его пределы (минимальный размер)??
- balabolka
- V.I.P.
Балаболка TTS
Не вижу принципиальной разницы. Диапазон от -10 до 10 придуман не мной, эти значения используются в SAPI 5.
- wasyaka
- V.I.P.
Балаболка TTS
Не правильно задал вопрос, сделать скорость плавней - 0; 1 - а между ними 0,1; 0,2... Как в Yandex TTS? Для меня Максим при 0 медленовато, а при 1 уже сильно быстро...
- good_cat
- Администратор
Балаболка TTS
Изменение скорости чтения SAPI5 производится по шкале целых чисел. Промежуточные значения можно получить при воспроизведении аудиофайлов некоторыми проигрывателями (например, AIMP). Или пользуясь программными средствами для перекодирования аудиофайлов (например, SONY Sound Forge).
- tonio_k
- V.I.P.
Балаболка TTS
Добавлю. Можно найти консольную версию таких программ. Создать bat файл к этой программе, который будет мониторить папку куда сохраняются wav файлы. (для этого В настройках Балаболки указать сохранение аудио в wav формате). И при появлении такого файла в папке назначения сразу начнётся конвертация в mp3 с изменениями в скорости воспроизведения.
Отправлено спустя 2 минуты 14 секунд:
Сейчас Балаболки под рукой нет посмотреть. Может в ней есть уже функция вызова стороннего консольного конверта аудио с параметрами. Тогда и bat файл не нужен будет
Отправлено спустя 8 минут 19 секунд:
balabolka, вообще идея с изменениями в скорости воспроизведения аудио средствами консольных программ кажется интересной. Может какую нибудь бесплатную протестировать на предмет совместимости с Балаболкой и сделать в настройках аудио записи шаблон команд по конвертации к этой программе? Саму программу скачивать отдельно.
- balaamster
- Обыватель
Балаболка TTS
SOX вполне совместим https://sourceforge.net/projects/sox/files/sox/14.4.2/
Давно им пользуюсь, проблем пока не обнаружил.
Распаковываем SOX в папку балаболки по пути utils\sox (например b:\Balabolka\utils\sox\)
В Балаболке: Shift+F5 - другие кодеки - добавить.
Название SOX OGG
Расширение звукового файла: OGG
Командная строка:
Код: Выделить всё
%BFolder%\utils\sox\sox.exe -G --multi-threaded -q %Input% -C 4 %Output% tempo -s 1.1 pitch -50 reverb 20 40 40
--multi-threaded - использовать многопоточность
-q - "тихий" режим, без вывода в консоль
-С 4 - уровень сжатия, в моно примерно 55 kbit/s
tempo -s 1.1 - увеличение темпа в 1.1 раза. -s - оптимизация под речь. (соответственно tempo -s 0.9 - замедление)
pitch -50 - понижение высоты голоса.
reverb 20 40 40 - добавление реверберации
Остальные ключи и функционал описаны в sox.pdf, лежит в папке с sox'ом
- balabolka
- V.I.P.
Балаболка TTS
Для изменения скорости речи в файле можно использовать утилиту SoX. Кстати, рекомендую обратить пристальное внимание на эту консольную утилиту: она содержит множество полезных функций, это своего рода "швейцарский нож" для работы со звуковыми файлами.
Версию для Windows можно скачать отсюда. Командная строка для изменения скорости будет выглядеть примерно так (ускорение речи в полтора раза):
Если есть необходимость выполнять эту процедуру при создании звуковых файлов в "Балаболке", можно добавить файл с расширением *.BAT как новый аудиокодек: пункт главного меню "Настройки|Аудиофайлы", вкладка "Другие кодеки". Командная строка для вызова кодека будет выглядеть примерно так:
Расширение звукового файла MP3.
Примерное содержимое файла SOX.BAT:
Программа "Балаболка" создаст звуковой файл формата WAV с речью, SoX ускорит речь, а кодек LAME преобразует WAV в MP3.
Версию для Windows можно скачать отсюда. Командная строка для изменения скорости будет выглядеть примерно так (ускорение речи в полтора раза):
Код: Выделить всё
sox input.wav output.wav tempo 1.5
Код: Выделить всё
E:\Temp\sox.bat %Input% %Output%
Примерное содержимое файла SOX.BAT:
Код: Выделить всё
@echo off
E:\Temp\sox.exe %1 "E:\Temp\temp.wav" tempo 1.5
E:\Temp\lame.exe "E:\Temp\temp.wav" %2
del "E:\Temp\temp.wav"
- balaamster
- Обыватель
Балаболка TTS
balabolka, эх, одновременно написали :)
UPD. Если в папку с sox подкинуть библиотеку libmp3lame.dll, то можно без отдельной конвертации lame'ом обойтись, в одну строку
Название: SOX MP3
Расширение звукового файла: MP3
-С 64.01 - 64 kbit/s с максимальным алгоритмическим качеством (сотые доли .01 - max, .09 - min)
UPD. Если в папку с sox подкинуть библиотеку libmp3lame.dll, то можно без отдельной конвертации lame'ом обойтись, в одну строку
Название: SOX MP3
Расширение звукового файла: MP3
Код: Выделить всё
%BFolder%\utils\sox\sox.exe -G --multi-threaded -q %Input% -C 64.01 %Output% tempo -s 1.1 pitch -50 reverb 20 40 40
- tonio_k
- V.I.P.
- balabolka
- V.I.P.
- Lecron
- Специалист
Балаболка TTS
Сколько пробовал, наилучшее качество получил в утилите SoundStretch v1.7.0 Written by Olli Parviainen в режиме -speech. В следующих версиях он поменял захардкоженные коэффициенты и субъективно, качество ухудшилось.
SoX для получения сходных версии 1.7.0 результатов, запускал с параметрами tempo 2 15 7 6, но от рычащих ноток избаится так и не смог. Вдобавок, у него, нет контроля клипинга. Приходилось немного приглушать vol -4dB
Еще, ускорение умеет делать комбайн ffmpeg. Параметр -filter:a "atempo=1.5" для 50% ускорения. А уж сконвертировать сможет всё во всё.
SoX для получения сходных версии 1.7.0 результатов, запускал с параметрами tempo 2 15 7 6, но от рычащих ноток избаится так и не смог. Вдобавок, у него, нет контроля клипинга. Приходилось немного приглушать vol -4dB
Еще, ускорение умеет делать комбайн ffmpeg. Параметр -filter:a "atempo=1.5" для 50% ускорения. А уж сконвертировать сможет всё во всё.
Вы, случайно, не поняли физический смысл этих значений? Это проценты или где? И зависит ли их вклад от используемого движка/голоса?
- tonio_k
- V.I.P.
Балаболка TTS
Мне работа Sox очень понравилась. Можно ваш вариант аудио выложить? (Оригинал и измененный файл)
- balaamster
- Обыватель
Балаболка TTS
Попробовал сравнить.
По моим ощущениям, при ускорении 1,2 SoX, SoundStretch v1.7.0 и SoundStretch v2.1.0 дают практически одинаковый результат.
при замедлении 0,8 SoX звучит более гладко, у обоих SoundStretch некоторое "булькание" пробивается.
https://yadi.sk/d/GfEwzIN5nkjYOg
- balabolka
- V.I.P.
Балаболка TTS
Скорость +10 в SAPI 5 - это 200% обычной скорости речи. -10 - это 50%.
Кончено, при чтении разных текстов разными голосами могут появиться дополнительные паузы, или какие-то символы могут читаться быстрее/медленнее, но в общем случае диапазон скоростей именно такой.
- balaamster
- Обыватель
Балаболка TTS
Поторопился с выводами. Забыл у SoundStretch добавить ключ -speech
Действительно, при замедлении до 0,8 (-20%), SoundStretch звучит чище, чем SoX. Например, можно на 0:03 в слове "назад" услышать, как у SoundStretch оно произносится без артефактов, а у SoX есть некоторые искажения.
При ускорении разницу всё также не ощутил.
Файл с тестовыми записями перезалил.
- Lecron
- Специалист
Балаболка TTS
Был бы ответ такой простой, я бы его сразу просек. Озвучиваемый текст:
► Показать
0 — 22 с.
+10 — 18 сек или +4 сек или +18%
–10 — 28 сек или -6 сек или -27%
Где логика? И в любом случае, до ±100% крайне далеко.
Отправлено спустя 1 минуту 29 секунд:
На 20% ее может и не слышно. Мне надо х2 и тут она слышна.
- wasyaka
- V.I.P.
Балаболка TTS
Словарь BXD
При переименовании из dic в bxd теряется структура словаря происходит сортировка (не всегда гут)
добавить выбор: обычное <> без сортировки?
Дубликаты
Произношение (Ctrl+P) - В dic сразу покаказывает,есть ли правило в словаре,
А как это решить в bxd?
При переименовании из dic в bxd теряется структура словаря происходит сортировка (не всегда гут)
добавить выбор: обычное <> без сортировки?
Дубликаты
Произношение (Ctrl+P) - В dic сразу покаказывает,есть ли правило в словаре,
А как это решить в bxd?
- balabolka
- V.I.P.
Балаболка TTS
Не могу полностью согласиться, что это необходимо. Но так как преобразование словаря из одного формата в другой выполняется только однажды, можно предлагать такой выбор. Добавлю в следующей версии.
Да, забыл это реализовать. Программа будет искать совпадение текста с шаблоном правила и показывать найденное правило в списке. Спасибо.
- balabolka
- V.I.P.
Балаболка TTS
Можно зациклить фоновый звуковой файл. Например, заранее создать звуковой файл, повторяющийся много раз:balaamster писал(а): duration=first - длительность выхода определяется длительностью первого потока. Первым потоком у нас в параметрах идёт синтезированная речь. Файл "подложки" выбираю заведомо больше минимальной длительности читаемого отрывка.
Код: Выделить всё
sox short.mp3 big.mp3 repeat 100
Код: Выделить всё
ffmpeg -filter_complex "amovie=short.wav:loop=100" big.wav
- balabolka
- V.I.P.
Балаболка TTS
Зациклить фоновый файл можно и таким способом:
На выходе получится звуковой файл такой же продолжительности, что и на входе, а фоновый аудиофайл будет проигрываться снова и снова.
Код: Выделить всё
ffmpeg -i speech.wav -filter_complex "amovie=background.wav:loop=100[s];[0][s]amix=duration=shortest" output.wav
- pikachu
- Наблюдатель
Балаболка TTS
Hi, опять я! А нельзя ли добавить Capslock если не сложно? Конечно не настолько нужен мне он,но всё же, мне удобнее будет. (обычно ставлю caps lock на push to talk)
- Вложения
-
- capslock.png (56.83 КБ) 55823 просмотра
- balabolka
- V.I.P.
- wasyaka
- V.I.P.
Балаболка TTS
Вставка текста >> Ctrl+T >> Ctrl+N >> не срабатывает форматирование текста.
Так задумано?
Так задумано?
- balabolka
- V.I.P.
Балаболка TTS
Да.
(То есть, не то, чтобы я специально над этим думал, но да, это кажется мне логичным.)
- fich
- Обыватель
Балаболка TTS
Здравствуйте, с наступающим.
появилось многоточие, если в Балаболке тапнуть мышью на " люди… " то цепляются и точки.
появилось многоточие, если в Балаболке тапнуть мышью на " люди… " то цепляются и точки.
- tonio_k
- V.I.P.
Балаболка TTS
Попробуйте произвести замену по всему тексту одного юникод символа:
Код: Выделить всё
…
Код: Выделить всё
...
- fich
- Обыватель
- tonio_k
- V.I.P.
Балаболка TTS
тут другая ситуация, выделение происходит по принципу: люди1 людиМ люди+ т.е. это символ воспринимается не как знак припенания, а как часть специально изменённого слова. Как вариант, попросить у разработчика добавить этот пункт в меню Настройки-Общие настройки вкладка текст.
Хотя всё легко решается добавлением правила в REX:
Код: Выделить всё
\…=...
Код: Выделить всё
*…*=...
- balabolka
- V.I.P.
- speech
- Обыватель
Балаболка TTS
вот только жаль что яндекс запарывался с этим символом - у меня несколько раз прогон книги через "Я" останавливался именно на этих спецсимволах ( ...
- balabolka
- V.I.P.
Балаболка TTS
В "Балаболке" текст, содержащий этот символ, преобразуется нормально (пункт главного меню "Сервис|Сохранить файл"). Не заметил проблем у "Яндекса" с чтением каких-либо символов; причина сбоя в чем-то еще.
- Ermolka89
- Наблюдатель
Балаболка TTS
Можно ли в "Балаболке" создавать прямую речь с разными голосами - мужским и женским?
Пыталась вставлять этот тег: <voice required=”Maxim=Microsoft Sam”>”Привет!”</voice>
выходит ошибка:
Пыталась вставлять этот тег: <voice required=”Maxim=Microsoft Sam”>”Привет!”</voice>
выходит ошибка:
- balaamster
- Обыватель
Балаболка TTS
<voice required=”Maxim=Microsoft Sam”>”Привет!”</voice>
Вместо Maxim должен стоять атрибут Name.
И кавычки должны быть обычные - " (QUOTATION MARK, код 0x22), а не ” (RIGHT DOUBLE QUOTATION MARK, код 0x201D)
Пробуйте такой вариант
Код: Выделить всё
<voice required="Name=Microsoft Sam">"Hello!"</voice>
- Ermolka89
- Наблюдатель
Балаболка TTS
А как тогда программа будет говорить нужным голосом? Я думала вместа слова Name нужно вводить имя голосового движка,женского или мужского.
А как еще можно подругому делать прямую речь диалогов мужчины и женщины?
Отправлено спустя 7 минут 47 секунд:
Сейчас вставила ваш код, вообще выдал ошибкуbalaamster писал(а): ↑05 янв 2019 15:34Пробуйте такой вариант
КОД: ВЫДЕЛИТЬ ВСЁ
<voice required="Name=Microsoft Sam">"Hello!"</voice>
- balaamster
- Обыватель
Балаболка TTS
Например так:
<voice required="Name=Microsoft Irina Desktop">"Hello, dear!"</voice>
<voice required="Name=Alan">"Hello, honey!"</voice>
У меня Win 10, там предустановлен голос Microsoft Irina Desktop. Дополнительно стоит RHVoice Alan.
Берёте фрагмент текста для мужского голоса, обрамляете его тегами <voice required="Name=Ваш мужской голос">Текст здесь</voice>. Для женского фрагмента поступаете также.
Имена голосов можно посмотреть в выпадающем меню вкладки sapi5, в Balabolka
Возможно, у Вас нет голоса Microsoft Sam в системе. Посмотрите доступные голоса и замените Microsoft Sam на один из них
- speech
- Обыватель
Балаболка TTS
"Сэм" вообще, кажется, был только на ХР. На новых win - Microsoft Irina (ru), и другие..
- Ermolka89
- Наблюдатель
Балаболка TTS
Я вставила ваш код. Вписала название голоса, вот что вышлоbalaamster писал(а): ↑05 янв 2019 16:34Берёте фрагмент текста для мужского голоса, обрамляете его тегами <voice required="Name=[bВаш мужской голос[/b]">Текст здесь</voice>. Для женского фрагмента поступаете также.
- balaamster
- Обыватель
Балаболка TTS
Там опечатка, которую я не успел вовремя исправить.
Для Maxim так:
<voice required="Name=IVONA 2 Maxim OEM">Текст здесь</voice>
- Ermolka89
- Наблюдатель
Балаболка TTS
Спасибо огромное!!!!!! Всё получилось!balaamster писал(а): ↑05 янв 2019 17:05<voice required="Name=IVONA 2 Maxim OEM">Текст здесь</voice>
Отправлено спустя 1 час 7 минут 11 секунд:
А где-нибудь можно скачать для балаболки детские голоса? девочки-мальчика
- balaamster
- Обыватель
- Ermolka89
- Наблюдатель
Балаболка TTS
Жаль!
Да я хотела этими голосами переводить какие-нибудь видео с английского на русский.... Зарабатывать на монетизации. Вот один для пробы перевела. НО НЕМНОЖКО ни так.