Страница 1 из 1
Обсуждение и ссылки
Добавлено: 08 авг 2018 21:58
Fenix
Здесь обсуждаем и делимся ссылками на веб-сайты, позволяющие преобразовать текст в речь.
Онлайн синтез от ЦРТ
Доступно 8 голосов. Русские голоса: Владимир, Юлия, Александр, Лидия, Анна и Мария. Ещё английский Carol, и казахский Asel.
Обсуждение и ссылки
Добавлено: 03 ноя 2018 03:02
balabolka
Amazon Polly – это сервис преобразования текста в речь, который с помощью продвинутых технологий глубокого обучения позволяет синтезировать речь, практически не отличимую от человеческой.
Уровень бесплатного пользования Amazon Polly включает 5 миллионов символов для преобразования в речь или в речевые метки ежемесячно в течение 12 месяцев с момента первого запроса на преобразование в речь. Ежемесячная плата начисляется в зависимости от количества обработанных символов текста. Стоимость использования Amazon Polly составляет 4 USD за 1 миллион символов для преобразования в речь.
Обсуждение и ссылки
Добавлено: 03 ноя 2018 03:15
balabolka
Google Cloud Text-to-Speech enables developers to synthesize natural-sounding speech with 30 voices, available in multiple languages and variants. It applies DeepMind’s groundbreaking research in WaveNet and Google’s powerful neural networks to deliver high fidelity audio.
Ежемесячный бесплатный лимит для стандартных голосов: 4 миллиона символов. При превышении лимита берется плата: $4 за 1 миллион символов.
Ежемесячный бесплатный лимит для голосов, использующих технологию WaveNet (нейронную сеть): 1 миллион символов. При превышении лимита берется плата: $16 за 1 миллион символов.
Обсуждение и ссылки
Добавлено: 01 фев 2021 02:58
Primkray
Fenix писал(а): ↑08 авг 2018 22:08
Онлайн синтез от ЦРТ
https://voicefabric.ru/ уже не доступен.
Сейчас Онлайн синтез от ЦРТ расположен по адресу
https://cloud.speechpro.com/service/tts
Голоса Владимир, Даша, Анна и Юлия.
Жаль, что только один мужской голос.
Тариф 535 за млн символов. Посимвольноя тарификация, Оплата по факту использования.
При регистрации начисляют 4000 руб. для теста.
Обсуждение и ссылки
Добавлено: 02 фев 2021 01:55
speech
Primkray писал(а): ↑01 фев 2021 02:58
Голоса Владимир, Даша, Анна и Юлия.
Я послушал, между прочим теле-версии играют лучше - чисто, без артефактов
Обсуждение и ссылки
Добавлено: 23 фев 2021 13:21
Primkray
Голоса от Microsoft Azure
https://azure.microsoft.com/ru-ru/servi ... to-speech/
6 русских голосов
- IMG_20210223_193614.png (115.95 КБ) 2408 просмотров
Голоса на основе нейросети (Neural) звучат очень не плохо.
По ценнику непонятно.
Обсуждение и ссылки
Добавлено: 23 фев 2021 16:56
tonio_k
Primkray писал(а): ↑23 фев 2021 13:21
6 русских голосов
flegont писал(а): ↑19 мар 2019 16:45
P.S. Например, стандартый Win 10 голос Pavel имхо неплох, и понимает UPS.
Пример звучания:
http://i91650e3.beget.tech/viewtopic.php?t=122&start=250#p1880
Получается, обладатели Win 10 уже имеют и могут локально использовать голос Pavel ( в частности). У меня Win 7 мне этот голос не доступен
Обсуждение и ссылки
Добавлено: 23 фев 2021 18:13
balabolka
Primkray писал(а): ↑23 фев 2021 13:21
По ценнику непонятно.
Цены на Cognitive Services, службы речи
Бесплатно - 5 Мб текста в месяц, платно - 250 руб. за преобразование одного мегабайт текста в речь.
Нейронные голоса дороже (0,5 Мб бесплатно, 1000 руб. за мегабайт).
Обсуждение и ссылки
Добавлено: 23 фев 2021 18:17
wasyaka
tonio_k писал(а): ↑23 фев 2021 16:56
Получается, обладатели Win 10 уже имеют и могут локально использовать голос Pavel
► Показать
- 3.png (32.82 КБ) 2395 просмотров
Там ещё с бубном надо пообщаться чтоб он выкатился и не фонтан, чтоб кидаться в бубен стучать...
Обсуждение и ссылки
Добавлено: 11 мар 2021 04:00
mikeinside
ЦРТ голоса очень понравились , записал себе книгу , но не хватает выбора скорости и словаря(на некоторых предложениях неправильное ударение)
Обсуждение и ссылки
Добавлено: 11 мар 2021 09:36
tonio_k
mikeinside писал(а): ↑11 мар 2021 04:00
но не хватает выбора скорости
решается при помощи консольной утилиты ffmpeg .exe есть и другие программы. Изменит скорость в любую сторону без изменения качества звучания. Но вы в внимательнее посмотрите в документации на их сайте. Скорость должна регулироваться. Напишите в тех поддержку.
mikeinside писал(а): ↑11 мар 2021 04:00
и словаря(на некоторых предложениях неправильное ударение)
из-за платности ЦРТ и урезанной демки на их сайте данный голос не особо популярен так что пользовательских словарей варят ли найдете. Придется вам самому создавать свои словари. На сколько мне известно поддерживаются тэги SSML и фонемы в IPA. В телеграмме ещё так можно ставить ударения:
► Показать
Этот бот может озвучить любой текст!
Вы можете выбрать голос введя команду "/voices"
Поддерживаются следующие SSML-теги:
1) указание ударного слога в слове
<say-as stress="2">комплаенс</say-as>
2) чтение числа как даты
<say-as interpret-as="date" format="mdy">3/6/02</say-as>
3) чтение числа как времени
<say-as interpret-as="time" format="hms24">12:00:00</say-as>
4) чтение числа как телефона
<say-as interpret-as="telephone">2222230</say-as>
Для увеличения пауз между предложениями поставьте пустые строки.
Для интонационного выделения слова в предложении поставьте "#" перед ним.
Поддерживается изменение темпа и тона речи, а также стиля.
Для ввода произвольного значения нажмите
Для применения заданного стиля нажмите
Для прочтения с другой интонацией нажмите
Поддерживается inlinе-режим.
Для использования в коммерческих целях технология доступна в облаке cloud.speechpro.com.
Обсуждение и ссылки
Добавлено: 12 мар 2021 04:44
mikeinside
tonio_k писал(а): ↑11 мар 2021 09:36
из-за платности ЦРТ и урезанной демки на их сайте данный голос не особо популярен так что пользовательских словарей варят ли найдете
Сейчас у них акция , при регистрации бесплатно 4000 рублей , а это 4млн слов бесплатно , плюс можно с любого левого эмэйла регистрироватся (для сравнения на сайте яндекса демо версия 5000 тыс слов , тут 10000 ) + бесплатные 4 млн. слов , но надо конструировать программу , это не проблема тем кто знаком с программированием
Обсуждение и ссылки
Добавлено: 26 мар 2021 17:44
depost
Всем здрасти. Запилил чрез Яндекс и ЦРТ.
Сказка про колобка
Обсуждение и ссылки
Добавлено: 26 мар 2021 20:20
andko
depost писал(а): ↑26 мар 2021 17:44
Всем здрасти. Запилил чрез Яндекс и ЦРТ.
ЦРТ бесплатно делали?
Обсуждение и ссылки
Добавлено: 26 мар 2021 22:48
depost
Да,все бесплатно. Потом в Audacity некоторые правил.
Высоту тона, реверберацию, задержку.
Яндекс:
Автор - Филипп нейтральный без изменений
Дед - Филипп радостный питч на 1,5 тона выше
Бабка - Омаж раздраженный питч на полтона ниже
Лиса - Алена радостный без изменений
ЦРТ:
Заяц - Даша 22кГц питч на 3 тона выше
Волк - Владимир 22кГц Реверберация с задержкой
Медведь - Владимир 22кГц питч на 2 тона ниже + Реверберация с задержкой
Обсуждение и ссылки
Добавлено: 04 апр 2021 12:20
S-a-b
[quote=tonio_k post_id=6008 time=1615444593 user_id=51]
Но вы в внимательнее посмотрите в документации на их сайте. Скорость должна регулироваться.[/quote]
Наверное, должна, но тоже на сайте не увидел. Может у кого есть более полная документация по апи синтеза речи облаком ЦРТ. Голоса действительно приятные. Писал скрипт на питоне, апк собрать не получилось, вернее, все собирается, и падает. Но в том же Pydroid3 работает хорошо
https://4pda.ru/forum/index.php?showtop ... =105550532
Обсуждение и ссылки
Добавлено: 04 апр 2021 15:07
Primkray
S-a-b писал(а): ↑04 апр 2021 12:20
Может у кого есть более полная документация по апи синтеза речи облаком ЦРТ
Поддержка ЦРТ присылала вот такую ссылку: Актуальные SSML- теги для синтеза доступны по ссылке:
http://ftp.speechpro.com/tech_support/p ... LinTTS.pdf
Обсуждение и ссылки
Добавлено: 20 апр 2021 18:24
wasyaka
S-a-b писал(а): ↑04 апр 2021 12:20
Писал скрипт на питоне, апк собрать не получилось, вернее, все собирается, и падает. Но в том же Pydroid3 работает хорошо
Это для Андрюши, а для винды?
Обсуждение и ссылки
Добавлено: 21 апр 2021 17:42
S-a-b
[quote=wasyaka post_id=6229 time=1618932252 user_id=71]
Это для Андрюши, а для винды?
[/quote]Да, для Windows не подойдет. Разве, что через эмулятор. Можно, наверное, переписать, чтобы запускался на винде и линуксе, при условии, что все зависимости будут установлены, тока оно кому-то надо?
Обсуждение и ссылки
Добавлено: 22 апр 2021 14:44
Okey
Добрый день.
В последней версии Балаболки при введении STR-файла для он-лайн синтеза речи Гугл Клауд ТТС теперь требуется вводить API ключ.
Где его взять?
Обсуждение и ссылки
Добавлено: 22 апр 2021 15:55
balabolka
Okey писал(а): ↑22 апр 2021 14:44
В последней версии Балаболки при введении STR-файла для он-лайн синтеза речи Гугл Клауд ТТС теперь требуется вводить API ключ. Где его взять?
Сервис синтеза речи от Google всегда был платным. Но существовали два способа пользоваться некоторыми голосами этого сервиса бесплатно; эти два способа по-прежнему доступны в "Балаболке". Применяйте их, как и прежде.
Платный сервис Google Cloud Text-To-Speech доступен по
этой ссылке. Зарегистрируйтесь в "облаке" (нужен аккаунт в почте Gmail), и Вам зачислят $300 на Ваш виртуальный счет. Деньги можно потратить в течении трех месяцев тестового периода.
В консоли "облака" создайте пустой проект, активируйте сервис синтеза речи (в разделе
"API Library") и создайте API-ключ (в разделе
"Credentials"). Всё, можно начать использовать платный сервис. Когда пробный период завершится, Google предложит активировать платную подписку; сами решайте, соглашаться или нет.
Обсуждение и ссылки
Добавлено: 22 апр 2021 23:14
Okey
Уф, как все сложно стало ) Хорошо, успел кой-что озвучить англ. диктором до введения этого API. Но и сейчас - нашел! - некоторые закладки хорошо озвучивают без заморочек с API
Огромное Вам спасибо! Потрясающая прога!
Обсуждение и ссылки
Добавлено: 03 май 2021 19:55
wasyaka
S-a-b писал(а): ↑21 апр 2021 17:42
для Windows не подойдет.
Чтото у меня и на Андрюше не ОК...
открывается в виде тхт...
Redmi 7A
Версия Андроид 10 QKQ1....
Pydroid 3 установил...
Обсуждение и ссылки
Добавлено: 04 май 2021 00:40
Okey
IBM Английский (Великобритания) Джеймс V3 - на коротких видео до 5 мин, работает.
Длинные видосы около 10 мин. все время выскакивает ошибка
Обсуждение и ссылки
Добавлено: 05 май 2021 06:52
wasyaka
wasyaka писал(а): ↑03 май 2021 19:55
Чтото у меня и на Андрюше не ОК...
Установилось только на скаченный с плей маркета, скаченный с 4pda - не прокатило...
Обсуждение и ссылки
Добавлено: 04 июн 2021 13:00
Primkray
ЦРТ добавили новые голоса, теперь у них 10 голосов: Даша, Александр, Анна, Виктория, Владимир, Галина, Мария, Михаил, Петр, Юлия.
https://cloud.speechpro.com/service/tts
Обсуждение и ссылки
Добавлено: 04 июн 2021 14:45
balabolka
"У нее прекрасное имя: Галя!" - "И, что примечательно, редкое."
Что примечательно, теперь все голоса на основе нейронных сетей (DNN). Обычные голоса убрали.