MyTTS

Nixaristix писал(а): ↑
22 фев 2021 21:09
Уже по разному экспериментирую с Филлипом, ставлю 1 поток и склеивать по 2 файла, много книжек уже прослушал так, все обрезаются постоянно, абзацы просто теряются, повторная озвучка ничего не меняет. Я так понял это у всех?

Да, подтверждаю, у меня такая же проблема, если стоит 5 потоков. Если 1 поток то не теряется (пока)

olelog писал(а): ↑
23 фев 2021 13:50
Да, подтверждаю, у меня такая же проблема, если стоит 5 потоков. Если 1 поток то не теряется (пока)

Прискорбно, у меня и на 1 потоке абзацы теряются. Пробовал Балаболку с Максимом, там без пропусков, но даже со словарями Максим после Филиппа совсем не то. Как после амброзии тухлую воду пить.

Nixaristix писал(а): ↑
23 фев 2021 17:02
Максим после Филиппа совсем не то. Как после амброзии тухлую воду пить.

"подсесть" - оно такое

еще немного и клиент будет готов "платить за качество".
Вот поэтому (в том числе) я предпочитаю оставаться на локальных голосах, которые обеспечивают техническую стабильность результата и независимость от изменчивого маркетинга "на облаках". Тем не менее кроме Филиппа у Яндекса еще есть старые голоса на старом сервере (доступ к ним осуществляется через другие сборки) - пока на их стабильность никто не жаловался.

tonio_k писал(а): ↑
23 фев 2021 18:14
пока на их стабильность никто не жаловался.

Не, ну там же премиум...

который также лажает как и обычные

- которые допиленные...

Nixaristix писал(а): ↑
23 фев 2021 17:02
Пробовал Балаболку с Максимом, там без пропусков, но даже со словарями Максим после Филиппа совсем не то. Как после амброзии тухлую воду пить.

Без труда не вытянешь рыбку из пруда...(Русская народная мудрость)
Актуальна во все времена...
Трудозатраты (усреднённо) - выхлоп - 2 минуты на час озвучки(ручками после машины) - и получим 2-3 ошибки на этот час при прослушке...
Не премиум (Андрей Круз, мария Круз
ВОЗЛЕ ТЬМЫ
Чужой)

► Показать

премиум

► Показать

Всё познаётся в сравнении...

Nixaristix писал(а): ↑
23 фев 2021 17:02
Прискорбно, у меня и на 1 потоке абзацы теряются. Пробовал Балаболку с Максимом, там без пропусков, но даже со словарями Максим после Филиппа совсем не то. Как после амброзии тухлую воду пить.

Если уж совсем Филипп плохо работает,(при условии если вы поменяли экзэшник "yndxfilipp" в программе) попробуйте ACrow(sz)v5.3 отличная прога для андроид, очень даже неплохой голос Вольц, ничуть не хуже Филиппа, записывает в mp3 файл, даже могу предложить свой словарь, которым в свое время занимался вплотную.

tonio_k писал(а): ↑
23 фев 2021 18:14
Вот поэтому (в том числе) я предпочитаю оставаться на локальных голосах

Несколько времени назад тов. Эхо писал про синтез уровня голосов Яндекса локально. Я тогда отнесся скептически, но поизучав немного тему, оказалось, что это вполне себе реально реализовать (наверное, еще не проверял). Речь, конечно же, про нейронки, и различные модели.
Более того, вполне возможно реализовать свой синтез на своих/любых голосах, при условии наличия нормального и достаточного датасета. В сети есть кое-какие датасеты, правда в основном на английском, но при желании можно создать свой собственный дата-сет, или даже скопировать любой голос Яндекса, что еще проще в теории.
Прошу прощения за сумбур, просто решил ответить насчет "локального синтеза".

Есть есть любопытство в этом вопросе, можно погуглить "tacotron", "tacotron2", "flowtron" etc. На гитхабе полно этого.
Сам планирую заняться этим делом в недалеком будущем (надеюсь дойдут руки в этом году).
Если у кого-то есть интерес - пишите, могу поделиться кое-какими ссылками, да и вообще, можно совместно изучать тему, и даже что-то пробовать.

speeck писал(а): ↑
24 фев 2021 20:34
Сам планирую заняться этим делом в недалеком будущем (надеюсь дойдут руки в этом году).
Если у кого-то есть интерес - пишите, могу поделиться кое-какими ссылками, да и вообще, можно совместно изучать тему, и даже что-то пробовать.

Информации про свой синтез на своих/любых голосах ("tacotron", "tacotron2", "flowtron") в сети много, но есть ли реальная реализация такого на SAPI5 или пока это только теория?

speeck писал(а): ↑
24 фев 2021 20:34
Сам планирую заняться этим делом в недалеком будущем (надеюсь дойдут руки в этом году).

Я уже пытался(на винде), но у меня нет карты нвидия. + Там все заточено именно под гпу(Это те что мульти язычные версии)
Пробовал анлг версию(цпу) реально копирует, но так как исходный дата сет не блестал качеством - результат соответсвующий. Да и сам не силен в питоне они все почти на питоне

Думаю копипрнуть голос Филипа будет не трудно, да и с дата сетом не будет сильных проблем
Если все же решишь напиши мне в вк vk/pin240

Primkray писал(а): ↑
25 фев 2021 01:48
Информации про свой синтез на своих/любых голосах ("tacotron", "tacotron2", "flowtron") в сети много, но есть ли реальная реализация такого на SAPI5 или пока это только теория?

SAPI5 то на кой вам сдался? Реализация да, есть. Голосовой помощник Олег от Тинькова, Маруся от Мейла, синтез Гугла, синтез Яндекса, синтез Амазона, синтез Azure от Мелкософт, синтез ЦРТ, синтез моего утюга (на подходе)......

olelog писал(а): ↑
24 фев 2021 11:37
Если уж совсем Филипп плохо работает,(при условии если вы поменяли экзэшник "yndxfilipp" в программе) попробуйте ACrow(sz)v5.3 отличная прога для андроид, очень даже неплохой голос Вольц, ничуть не хуже Филиппа, записывает в mp3 файл, даже могу предложить свой словарь, которым в свое время занимался вплотную.

Спасибо, экзешник Филиппа не трогал, я так понимаю косяк с пропажей абзацев в самом сервисе яндекса. ACrow(sz)v5.3 после установки не запускается, телефон Xiaomi Redmi 8 PRO. На всякий попробовал предыдущую сборку ACrow(sz)v5.2а, тоже не запускается (длинный лог с ошибкой из java кода). Поищу другие сборки Play_5, остается надежда, что косяк в сборке.

Nixaristix писал(а): ↑
26 фев 2021 13:39
ACrow(sz)v5.3 после установки не запускается, те

при установке ACrow(sz)v5.3 у меня не просит никаких разрешений. Поэтому и вылетает. Вот что надо сделать:
Надо сразу после установки ACrow(sz)v5.3 зайти в настройки самого смартфона, найти в них пункт "Приложения"(или управление приложениями у кого-то как) найти в списке приложений ваш ACrow(sz)v5.3, зайти в него и вручную в пункте разрешения или доступы активировать вручную галочку - дать разрешение к памяти телефона. И только после этого пробуем запустить ACrow(sz)v5.3
Дополнительно для стабильной работы не забудьте с умного режима экономии батареек перейти на постоянную работу. Что бы ACrow(sz)v5.3 работал в фоне без сбоев

Яндекс стал просто перестал работать. Даже на одном потоке через двадцать -тридцать частей просто тупо останавливается и все. Похоже надо переходить на что ли бо другое. Записать небольшую книжку уходит под пару часов. Можно ли что либо поделать с этим "yndx_tts64 " или финал ?

olelog, у меня все в порядке на 4 потоках 0% ошибок, стоит размер фрагмента h=3500 вместо h=4950 в Play_5.hta. У вас установлен фикс - viewtopic.php?f=55&t=59&sid=a5a2fae5e28 ... =700#p5228 ? Попробуйте уменьшить параметр h=.

GIS88 писал(а): ↑
28 фев 2021 16:40
размер фрагмента h=3500 вместо h=4950

Если бы ошибка было в этом, то фрагмент не записался бы никогда. А у olelog он рано или поздно таки озвучивается.
Если яндекс ограничивает количество запросов на единицу времени, многое может зависеть от скорости канала. Если синтезированное аудио забирать "медленно", то 4 потока могут дать меньшую нагрузку, чем при одном быстром потоке. Или на этом "сером" IP оказался еще один любитель яндекс-книжек. Долго можно гадать, почему результат непредсказуем.

Lecron писал(а): ↑
28 фев 2021 19:58
Долго можно гадать, почему результат непредсказуем.

http://i91650e3.beget.tech/viewtopic.php?t=59&start=500#p4810
т.е. проблемы из-за с количества символов на странице Яндекса наблюдаются давно.

Друзья, чудом наткнулся на ваш ресурс. помогите. я в отчаянии. с ребёнком десятиклассником делаем проект на тему синтеза речи. думал что смогу справиться с яндексом и интегрировать всё на наш проектный сайт. Идея сайта проста: озвучка любимых книг. Зарегились в Яндексе, получили системный аккаунт, постоянный ключ, но дальше не врубаемся что делать то. Может есть у кого код какой простой который я могу на сайт воткнуть. нам пока не надо ни каких заморочек со словарём и голосами. хоть бы окошечко для ввода текста замострячить и кнопочкой плей и ссылочкой для скачивания файла. Готов отблагодарить за помощь. Спасите. Защита на носу (

GIS88 писал(а): ↑
28 фев 2021 16:40
olelog, у меня все в порядке на 4 потоках 0% ошибок, стоит размер фрагмента h=3500 вместо h=4950 в Play_5.hta. У вас установлен фикс - viewtopic.php?f=55&t=59&sid=a5a2fae5e28 ... =700#p5228 ? Попробуйте уменьшить параметр h=.

у меня все фрагменты по 3500 в среднем по 5 минут записи. И раньше все работало как часы даже на 5 потоках. В настоящий момент идут постоянно пропуски, а на одном потоке просто зависает и все.Это глючный сервис яндекса

Nixaristix писал(а): ↑
23 фев 2021 17:02
Может есть у кого код какой простой который я могу на сайт воткнуть. нам пока не надо ни каких заморочек со словарём и голосами. хоть бы окошечко для ввода текста замострячить и кнопочкой плей и ссылочкой для скачивания файла

Так вот же описание с примерами
https://cloud.yandex.ru/docs/speechkit/tts/request
Но надо обладать навыками программирования..

вот с навыками программирования как раз туго (. Я поэтому и спросил может есть у кого завалялся кусочек кода для вставки на веб страницу с формой для ввода текста и всеми вытекающими...

kosygin писал(а): ↑
02 мар 2021 14:00
может есть у кого завалялся кусочек кода для вставки на веб страницу с формой для ввода текста

Примерно такой код для вставки на страницу.
Чтобы начать пользоваться API Яндекса надо еще получить IAM-токен и идентификатора каталога и эти данные вставить в скрипт. Причем время жизни IAM-токена — не больше 12 часов

► Показать

Код: Выделить всё

<html>
 <head>
  <title>Ввод данных</title>
 </head>
 <body>
 <form action="tts.php" method="post">
  <p><b>Cинтез речи голосами Яндекс</b></p>
   <p><textarea placeholder="введите текст" name="text_tts" rows="10" cols="45"><?php if(count($_POST['text_tts'])>0) print $_POST['text_tts'];?></textarea>
   <p><input type="submit" value="отправить"></p>
 </form>


<?php

const FORMAT_PCM = "lpcm";
const FORMAT_OPUS = "oggopus";
$voice = "ermil"; //голос
$speed = "1.0"; //скорость
$text_tts=$_POST['text_tts'];

if(count($_POST)>0){

$token = 'ВАШ_IAM_ТОКЕН'; # IAM-токен
$folderId = "ВАШ_Идентификатор каталога"; # Идентификатор каталога
$url = "https://tts.api.cloud.yandex.net/speech/v1/tts:synthesize";

$post = "text=" . urlencode("$text_tts") . "&lang=ru-RU&voice=$voice&speed=$speed&folderId=${folderId}&sampleRateHertz=48000&format=" . FORMAT_PCM;

$headers = ['Authorization: Bearer ' . $token];
$ch = curl_init();

curl_setopt($ch, CURLOPT_AUTOREFERER, TRUE);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, TRUE);
curl_setopt($ch, CURLOPT_HEADER, false);
if ($post !== false) {
    curl_setopt($ch, CURLOPT_POST, 1);
    curl_setopt($ch, CURLOPT_POSTFIELDS, $post);
}
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);


$response = curl_exec($ch);
if (curl_errno($ch)) {
    print "Error: " . curl_error($ch);
}
$test=curl_getinfo($ch, CURLINFO_HTTP_CODE);
//echo"$test";

if (curl_getinfo($ch, CURLINFO_HTTP_CODE) != 200) {
    $decodedResponse = json_decode($response, true);
    echo "Error code: " . $decodedResponse["error_code"] . "\r\n";
    echo "Error message: " . $decodedResponse["error_message"] . "\r\n";
} else {
      file_put_contents("audio.wav", $response);

}

curl_close($ch);

?>

<a href=http://ВАШ_САЙТ/audio.wav>Скачать файл</a>

<?php } ?>

</head>
</html>

Данные в получаемом аудиофайле кодируются с помощью аудиокодека OPUS и упаковываются в контейнер OGG (OggOpus). Для перекодирования его в wav или mp3 на сервере нужны дополнительные установки на сервере.
Естественно Ваш хостинг на сервере должен поддерживать curl и php

Спасибо огромное!!! Попробуем разобраться.

Вопрос к "разработчику" )) "yndx_tts64", возможно что либо еще сделать в программе, что бы как то более тщательно "перематывала" находила и дописывала пропущенные части Ogg файлов ? На одном потоке не пропускает, однако зависает после 20-30 записей, на 4-5 потоках обязательно один- два потеряет особенно вначале и уже не ищет.

Халява кончилась.

Теперь при использовании демо сервис иногда вставляет фразы "Генерация голоса выполнена с помощью Яндекс.Speechkit" или "Озвучено Яндекс.Speechkit" (до или после текста).

balabolka писал(а): ↑
10 мар 2021 14:44
Халява кончилась.

Теперь при использовании демо сервис иногда вставляет фразы "Генерация голоса выполнена с помощью Яндекс.Speechkit" или "Озвучено Яндекс.Speechkit" (до или после текста).

это еще ладно, этот шлак еще можно как то выдержать, а вот начались постоянные ошибки при записи, пропуски фрагментов, книгу невозможно записать за один раз. В среднем на одном потоке приходится лепить папки из 35 фрагментов по 5 мин. Кстати эти "вставки" только на голосе "филип" или наблюдается на других голосах ?

olelog писал(а): ↑
10 мар 2021 16:26
Кстати эти "вставки" только на голосе "филип" или наблюдается на других голосах ?

В демо на сайте эти "вставки" у всех голосов. Разные фразы, то в начале, то в конце текста.

Извиняюсь , что не в том разделе пишу , но на сайте ЦРТ если зарегистрироватся дают бесплатно тариф на 4000 рублей , но по умолчанию в их программе можно озвучить только 10000 слов , но даются ссылки на инструменты чтобы сконструировать программу , например из python , если кто соображает может запилите программу ? чтоб можно было выбирать голоса и особенно скорость голоса , по типу яндекса

mikeinside писал(а): ↑
11 мар 2021 00:24
если кто соображает может запилите программу ? чтоб можно было выбирать голоса и особенно скорость голоса , по типу яндекса

Присоединяюсь к предложению, было бы неплохо, если была бы такая возможность.

Всем привет, обнаружил для себя TTS Yandex Speechkit (Филипп) в начале этого года и нагенерировал-наслушал много всего интересного, и вдруг, сегодня обнаружил вставки "Создано с помощью Яндекс Спычкыт" чуть ли не после каждого предложения (всё генерировал Балаболкой).

Мои опасения подтвердились, когда я прочитал последние пару сообщений в этой теме.

Как будем бороться с этими "водяными знаками"?

Моя первая мысль, это выделить этот кусок и удалить подобные (мне кажется, у Adobe Audition может быть похожий функционал, надо погуглить). Там несколько вариантов, но они все похожие, надо их выловить.

Droid писал(а): ↑
11 мар 2021 22:29
выделить этот кусок и удалить подобные

Когда-то давно mp3book2005 был платным и практиковал вставлять подобный водяной текст в начале каждого аудиофайла. Тогда я Нашёл в интернете консольную утилиту, которая в wav файлах отрезала начало файла по таймингу (именно тогда я впервые узнал что такое bat-ники

). Но сейчас, как я понял, проблема водяных знаков в том, что они "плавающие". Нет четкой закономерности в водяных вставках, что бы запрограммировать вырезку отрезков "неглядя" и применить пакетно к списку аудио файлов. Возникает необходимость выслушать каждый файл, найти участок, вырезать через стороннюю программу и перейти к следующему. Затраты физические и по времени ради одной книги слишком высоки (если нужно озвучивать ролик в 5-10 минут, то можно и заморочиться).
Вот она вся прелесть облачных сервисов: Ни скачать, ни взломать. А к хорошему привыкаешь быстро: http://i91650e3.beget.tech/viewtopic.php?f=55&t=59&p=6021#p5734
Вся надежда на гениев-энтузиастов http://i91650e3.beget.tech/viewtopic.php?f=52&t=137 только когда это будет?

Да, всё верно, "водяные знаки" плавающие, я не просто так вспомнил про Audition.
Я помню там была функция избавления от шума: выделяешь фрагмент чистого шума и потом он ищет похожее на этот шум во ВСЁМ файле и чистит.

Поэтому у меня возникла аналогия выделить этот кусок (одно предложение) и чтобы программа автоматически удалила их во всём файле. Пока на уровне идеи, не знаю, умеет ли Audition такое.

Прослушивать и чистить, конечно не вариант.

Кстати, как вариант, убрать переносы строки и превратить всё в одно огромное предложение.
Надо потестить как много рекламных вставок там будет.

Update: Похоже, нашёл, что искал, сейчас попробуем.

Primkray писал(а): ↑
03 мар 2021 08:58
Данные в получаемом аудиофайле кодируются с помощью аудиокодека OPUS и упаковываются в контейнер OGG (OggOpus). Для перекодирования его в wav или mp3 на сервере нужны дополнительные установки на сервере.

Печаль(( дальше совсем непонятно что делать с файлом получившимся. он ничем не открывается. А как перекодировать raw в wav не понятно совсем( Вот что получается: http://textsynth.ru/

kosygin писал(а): ↑
18 мар 2021 18:30
Печаль(( дальше совсем непонятно что делать с файлом получившимся. он ничем не открывается. А как перекодировать raw в wav не понятно совсем( Вот что получается: http://textsynth.ru/

Обратись в поддержку облака, тебе должны там подсказать.

А вот так не воспроизводит?

Код: Выделить всё

<audio controls>
  <source src="audio.ogg" type="audio/ogg">Файл
</audio>

Или поставить на сервер ffmpeg и
<?php
$output = system("ffmpeg -i file.ogg file.mp3");
echo $output;
?>

kosygin писал(а): ↑
18 мар 2021 18:30
А как перекодировать raw в wav не понятно совсем

Вы получаете данные в аудиоформате lpcm (как описано в документации). Надо вставить заголовок RIFF в начало этих данных, и получится файл формата WAV. На странице документации указаны параметры аудиоданных:

Дискретизация — 48 кГц
Количество каналов - 1 (моно)
Порядок байтов — обратный (little-endian)

Зная эти значения, можно вставить заголовок вручную, заполнив все поля. Или можно найти утилиту, которая умеет это делать; например, FFmpeg:

Код: Выделить всё

ffmpeg -f s16le -ar 48k -ac 1 -i speech.raw speech.wav

Также, можно сразу создать файл формата MP3 с помощью утилиты LAME:

Код: Выделить всё

lame -r -s 48 -m m speech.raw speech.mp3

Рекомендую получать данные в аудиоформате oggopus и работать с ними: размер файлов, скачиваемых с сервера "Яндекса", будет меньше, поэтому процесс займет меньше времени. Формат lpcm без заголовка используется, например, для трансляций на YouTube или Twich в режиме реального времени: в этих случаях аудиопоток уже существует, и аудиоданные напрямую копируются в этот поток, без каких-либо перекодировок.

Использую в последнее время сборку Play_5 2018 года, проблемы описанной выше о постоянном повторении "Озвучено Яндекс.Speechkit" не выявлено. Данная фраза говорится лишь в начале аудиокниги. Сегодня записал новую книжку, все четко, как и раньше.

Nixaristix писал(а): ↑
25 мар 2021 14:05
Play_5 2018 года

Существуют два разных демо для речевого синтеза "Яндекса":

старое демо, где нет премиум-голосов;
новое демо, с премиум голосами "Алёна" и "Филипп".

Play_5 использует старое демо; там всё работает нормально, без добавления рекламных фраз.

В новом демо периодически добавляются фразы вроде "Запись сгенерирована в Yandex Cloud" (для всех голосов, не только для премиум).

Всё ещё бьёмся с сайтом проектной работы https://textsynth.ru :(( Подскажите, пожалуйста, что делаем не так? Вводим в форму текст, отправляем форму, а синтезированный текст можно услышать только если после синтеза зайти в режим инкогнито например хрома. а в обычном режиме в плеере слышим прошлое сообщение и то не всегда. Вот код страницы:

Код: Выделить всё

<form action="https://textsynth.ru/index.php" method="post">
  <p><b>Cинтез речи голосами Яндекс</b></p>
   <p><textarea placeholder="введите текст" name="text_tts" rows="10" cols="45">

<?php if(count($_POST['text_tts'])>0) print $_POST['text_tts'];?>
</textarea>
   <p><input type="submit" value="синтезировать"></p>
 </form>

<?php
//const FORMAT_PCM = "lpcm";
//const FORMAT_OPUS = "oggopus";
//$voice = "ermil"; //голос
//$speed = "1.0"; //скорость
$text_tts=$_POST['text_tts'];

if(count($_POST)>0)
{

$token = "t1.9euelZrGi5jMncqTmIqXlpKdz5KOzO3rnpWalJ2PmYudm5SbmZKTz82OzJbl8_cfV3Z8-e93R2Yr_t3z918FdHz573dHZiv-.eyuxlkuutqrVRiyvtOltkCY456LhLJX68kEBd3qV5uOX3dUdhhZMZ9zl_5ayMlTG82QdSMusjK3eDrAVMZ7ODg"; # IAM-токен
$folderId = "b1gtn8mr7m27i30tbtg1"; # Идентификатор каталога

$url = "https://tts.api.cloud.yandex.net/speech/v1/tts:synthesize";
//$post = "text=" . urlencode("$text_tts") . "&lang=ru-RU&voice=$voice&speed=$speed&folderId=${folderId}&sampleRateHertz=48000&format=" . FORMAT_PCM;
$post = "text=" . urlencode("$text_tts") . "&lang=ru-RU&folderId=${folderId}";
$headers = ['Authorization: Bearer ' . $token];
$ch = curl_init();

curl_setopt($ch, CURLOPT_AUTOREFERER, TRUE);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, TRUE);
curl_setopt($ch, CURLOPT_HEADER, false);
if ($post !== false) {
    curl_setopt($ch, CURLOPT_POST, 1);
    curl_setopt($ch, CURLOPT_POSTFIELDS, $post);
}
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);


$response = curl_exec($ch);
if (curl_errno($ch)) {
    print "Error: " . curl_error($ch);
}
//$test=curl_getinfo($ch, CURLINFO_HTTP_CODE);
//echo"$test";

if (curl_getinfo($ch, CURLINFO_HTTP_CODE) != 200) {
    $decodedResponse = json_decode($response, true);
    echo "Error code: " . $decodedResponse["error_code"] . "\r\n";
    echo "Error message: " . $decodedResponse["error_message"] . "\r\n";
} else {
    file_put_contents("speech.ogg", $response);
}
curl_close($ch);
}
?>


<audio controls>
  <source src="https://textsynth.ru/speech.ogg" type="audio/ogg">Файл
</audio>

<br><br><br>
<a href="https://textsynth.ru/speech.ogg">Скачать файл</a>

kosygin
Надо дождаться ответа от curl, синтез речи не происходит мгновенно. Можно попробовать добавить что-то типа этого:

Код: Выделить всё

curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
curl_setopt($ch, CURLOPT_TIMEOUT, 10);

P.S. То есть, у Вас на сайте будет халявный доступ к платному Yandex Speechkit? Тогда ставьте ограничение, например, на максимальное количество запросов к серверу (limit_req или что-то подобное), иначе разоритесь. Мой Вам совет.

kosygin писал(а): ↑
30 мар 2021 02:04
синтезированный текст можно услышать только если после синтеза зайти в режим инкогнито например хрома. а в обычном режиме в плеере слышим прошлое сообщение и то не всегда.

Если у вас каждый раз аудиофайл сохраняется на сервере под одним и тем же именем, то для браузера это один и тот же урл, и если явно не рулить кэшированием то ему, проще взять файл из кэша, чем каждый раз заново перекачивать. Так что надо либо запрещать кэширование тем или иным способом, или прилеплять к имени файла случайный элемент, типа "speech493532.ogg", чтоб имя было каждый раз разным. Тем более для публичного сервиса, где может быть одновременно несколько запросов, файл озвученный одним пользователем, может быть тут же переписан другим, до того как первый успеет его прослушать, потому что имя файла во всех запросах одинаковое. Только в этом случае надо на первых порах, хотя бы вручную раз в несколько дней удалять с сервера сохраненные аудиофайлы, чтобы не превысить лимит по занятому месту. Если сервис будет пользоваться популярностью, то удалять автоматом допустим раз в сутки по расписанию.

Запись сгенерирована в Yandex Cloud ломает сборку. Нужно открыть `Demagog-Yandex_Filipp\_Tests_\YandexTTS\PlayYandex.lua` и заменить `f = Fragments(s,4500)`

dlr5668,
Вы пишете

dlr5668 писал(а): ↑
13 апр 2021 03:51
Запись сгенерирована в Yandex Cloud ломает сборку.

У меня сборка Демагога с голосом Филиппа не ломается, нормально работает. Только появляется дополнительная фраза о том, что сгенерировано в Яндексе.
Еще Вы пишите

dlr5668 писал(а): ↑
13 апр 2021 03:51
Нужно открыть `Demagog-Yandex_Filipp\_Tests_\YandexTTS\PlayYandex.lua` и заменить `f = Fragments(s,4500)

но не пишете на что заменить.
Будьте так добры, поясните, что Вы имели ввиду этими двумя фразами.
Спасибо.

Crow (sz) 5.0 (Windows)
Чтение книг вслух голосами Яндекса

Версия на новой основе (Работает!)
- чтение вслух
- создание аудиокниг

Crow5.0.zip: (4.16 МБ) 110 скачиваний

SZ-Vtk писал(а): ↑
11 май 2021 09:28
Crow (sz) 5.0 (Windows)
Чтение книг вслух голосами Яндекса

Большое спасибо за приложение. Установил. Озвучил книгу. Качество отличное! По времени озвучивает несколько быстрее, чем Демагог.
На Андроиде также пользуюсь Вашей разработкой.

Crow (sz) 5.1 (Windows)
Чтение книг голосами Яндекса

исправления:
ошибка в словаре в сокращениях
изменение чтения сразу после изменения параметров голоса
улучшения:
обложка книги

Crow5.1.zip: (687.17 КБ) 120 скачиваний

SZ-Vtk, клёво, спасибо!..

SZ-Vtk писал(а): ↑
18 май 2021 09:09
Crow (sz) 5.1 (Windows)
Чтение книг голосами Яндекса

огромное спасибо за приложение, оно шикарно!!!

Прошу, кто знает как вносить исправления в словарь (какой символ, что означает), помогите разобраться, пожалуйста. При работе со словорем через приложение выбрасывает ошибку при попытке сохранения.

в строке типа (бойц*=бойтс+) озвучивает знак "+"

gor писал(а): ↑
26 май 2021 15:21
в строке типа (бойц*=бойтс+) озвучивает знак "+"

бойцо*=бойтс+о

Добрый день, подскажите следующий момент скачал Demagog-Yandex_Filipp_2020.12.07 так как нужен именно Филип, запустил все вроде работает, но озвучиваю пару раз и антивирус avast начинает ругаться на файл Demagog.exe что там вирус IDP Generic ну и удаляет его, поясните плиз это.
Следующий вопрос, на странице примеров у яндекса https://cloud.yandex.ru/services/speech ... -solutions совершенно другие голоса роботов которых нет в списке демо, как их получить? они есть в платной версии?

MyTTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS

Yandex TTS