Обсуждение и ссылки

Ответить
Аватара пользователя
Fenix
Администратор

Обсуждение и ссылки

#1

Сообщение Fenix »

Здесь обсуждаем и делимся ссылками на веб-сайты, позволяющие преобразовать текст в речь.


Онлайн синтез от ЦРТ
Доступно 8 голосов. Русские голоса: Владимир, Юлия, Александр, Лидия, Анна и Мария. Ещё английский Carol, и казахский Asel.

Аватара пользователя
balabolka
V.I.P.

Обсуждение и ссылки

#2

Сообщение balabolka »

Amazon Polly – это сервис преобразования текста в речь, который с помощью продвинутых технологий глубокого обучения позволяет синтезировать речь, практически не отличимую от человеческой.

Уровень бесплатного пользования Amazon Polly включает 5 миллионов символов для преобразования в речь или в речевые метки ежемесячно в течение 12 месяцев с момента первого запроса на преобразование в речь. Ежемесячная плата начисляется в зависимости от количества обработанных символов текста. Стоимость использования Amazon Polly составляет 4 USD за 1 миллион символов для преобразования в речь.

Аватара пользователя
balabolka
V.I.P.

Обсуждение и ссылки

#3

Сообщение balabolka »

Google Cloud Text-to-Speech enables developers to synthesize natural-sounding speech with 30 voices, available in multiple languages and variants. It applies DeepMind’s groundbreaking research in WaveNet and Google’s powerful neural networks to deliver high fidelity audio.

Ежемесячный бесплатный лимит для стандартных голосов: 4 миллиона символов. При превышении лимита берется плата: $4 за 1 миллион символов.
Ежемесячный бесплатный лимит для голосов, использующих технологию WaveNet (нейронную сеть): 1 миллион символов. При превышении лимита берется плата: $16 за 1 миллион символов.

Аватара пользователя
Primkray
Обыватель

Обсуждение и ссылки

#4

Сообщение Primkray »

Fenix писал(а):
08 авг 2018 22:08
Онлайн синтез от ЦРТ
https://voicefabric.ru/ уже не доступен.
Сейчас Онлайн синтез от ЦРТ расположен по адресу https://cloud.speechpro.com/service/tts
Голоса Владимир, Даша, Анна и Юлия.
Жаль, что только один мужской голос.
Тариф 535 за млн символов. Посимвольноя тарификация, Оплата по факту использования.
При регистрации начисляют 4000 руб. для теста.

Аватара пользователя
speech
Обыватель

Обсуждение и ссылки

#5

Сообщение speech »

Primkray писал(а):
01 фев 2021 02:58
Голоса Владимир, Даша, Анна и Юлия.
Я послушал, между прочим теле-версии играют лучше - чисто, без артефактов

Аватара пользователя
Primkray
Обыватель

Обсуждение и ссылки

#6

Сообщение Primkray »

Голоса от Microsoft Azure
https://azure.microsoft.com/ru-ru/servi ... to-speech/
6 русских голосов
IMG_20210223_193614.png
IMG_20210223_193614.png (115.95 КБ) 2407 просмотров
Голоса на основе нейросети (Neural) звучат очень не плохо.
По ценнику непонятно.

Аватара пользователя
tonio_k
V.I.P.

Обсуждение и ссылки

#7

Сообщение tonio_k »

Primkray писал(а):
23 фев 2021 13:21
6 русских голосов
flegont писал(а):
19 мар 2019 16:45
P.S. Например, стандартый Win 10 голос Pavel имхо неплох, и понимает UPS.
Пример звучания:
http://i91650e3.beget.tech/viewtopic.php?t=122&start=250#p1880
Получается, обладатели Win 10 уже имеют и могут локально использовать голос Pavel ( в частности). У меня Win 7 мне этот голос не доступен

Аватара пользователя
balabolka
V.I.P.

Обсуждение и ссылки

#8

Сообщение balabolka »

Primkray писал(а):
23 фев 2021 13:21
По ценнику непонятно.
Цены на Cognitive Services, службы речи
Бесплатно - 5 Мб текста в месяц, платно - 250 руб. за преобразование одного мегабайт текста в речь.
Нейронные голоса дороже (0,5 Мб бесплатно, 1000 руб. за мегабайт).

Аватара пользователя
wasyaka
V.I.P.

Обсуждение и ссылки

#9

Сообщение wasyaka »

tonio_k писал(а):
23 фев 2021 16:56
Получается, обладатели Win 10 уже имеют и могут локально использовать голос Pavel
► Показать
Там ещё с бубном надо пообщаться чтоб он выкатился и не фонтан, чтоб кидаться в бубен стучать...

Аватара пользователя
mikeinside
Интересующийся

Обсуждение и ссылки

#10

Сообщение mikeinside »

ЦРТ голоса очень понравились , записал себе книгу , но не хватает выбора скорости и словаря(на некоторых предложениях неправильное ударение)

Аватара пользователя
tonio_k
V.I.P.

Обсуждение и ссылки

#11

Сообщение tonio_k »

mikeinside писал(а):
11 мар 2021 04:00
но не хватает выбора скорости
решается при помощи консольной утилиты ffmpeg .exe есть и другие программы. Изменит скорость в любую сторону без изменения качества звучания. Но вы в внимательнее посмотрите в документации на их сайте. Скорость должна регулироваться. Напишите в тех поддержку.
mikeinside писал(а):
11 мар 2021 04:00
и словаря(на некоторых предложениях неправильное ударение)
из-за платности ЦРТ и урезанной демки на их сайте данный голос не особо популярен так что пользовательских словарей варят ли найдете. Придется вам самому создавать свои словари. На сколько мне известно поддерживаются тэги SSML и фонемы в IPA. В телеграмме ещё так можно ставить ударения:
► Показать

Аватара пользователя
mikeinside
Интересующийся

Обсуждение и ссылки

#12

Сообщение mikeinside »

tonio_k писал(а):
11 мар 2021 09:36
из-за платности ЦРТ и урезанной демки на их сайте данный голос не особо популярен так что пользовательских словарей варят ли найдете

Сейчас у них акция , при регистрации бесплатно 4000 рублей , а это 4млн слов бесплатно , плюс можно с любого левого эмэйла регистрироватся (для сравнения на сайте яндекса демо версия 5000 тыс слов , тут 10000 ) + бесплатные 4 млн. слов , но надо конструировать программу , это не проблема тем кто знаком с программированием

Аватара пользователя
depost
Прохожий

Обсуждение и ссылки

#13

Сообщение depost »

Всем здрасти. Запилил чрез Яндекс и ЦРТ.
Сказка про колобка

Аватара пользователя
andko
Обыватель

Обсуждение и ссылки

#14

Сообщение andko »

depost писал(а):
26 мар 2021 17:44
Всем здрасти. Запилил чрез Яндекс и ЦРТ.
ЦРТ бесплатно делали?

Аватара пользователя
depost
Прохожий

Обсуждение и ссылки

#15

Сообщение depost »

Да,все бесплатно. Потом в Audacity некоторые правил.
Высоту тона, реверберацию, задержку.
Яндекс:
Автор - Филипп нейтральный без изменений
Дед - Филипп радостный питч на 1,5 тона выше
Бабка - Омаж раздраженный питч на полтона ниже
Лиса - Алена радостный без изменений
ЦРТ:
Заяц - Даша 22кГц питч на 3 тона выше
Волк - Владимир 22кГц Реверберация с задержкой
Медведь - Владимир 22кГц питч на 2 тона ниже + Реверберация с задержкой

Аватара пользователя
S-a-b
Обыватель

Обсуждение и ссылки

#16

Сообщение S-a-b »

[quote=tonio_k post_id=6008 time=1615444593 user_id=51]
Но вы в внимательнее посмотрите в документации на их сайте. Скорость должна регулироваться.[/quote]
Наверное, должна, но тоже на сайте не увидел. Может у кого есть более полная документация по апи синтеза речи облаком ЦРТ. Голоса действительно приятные. Писал скрипт на питоне, апк собрать не получилось, вернее, все собирается, и падает. Но в том же Pydroid3 работает хорошо
https://4pda.ru/forum/index.php?showtop ... =105550532

Аватара пользователя
Primkray
Обыватель

Обсуждение и ссылки

#17

Сообщение Primkray »

S-a-b писал(а):
04 апр 2021 12:20
Может у кого есть более полная документация по апи синтеза речи облаком ЦРТ
Поддержка ЦРТ присылала вот такую ссылку: Актуальные SSML- теги для синтеза доступны по ссылке:
http://ftp.speechpro.com/tech_support/p ... LinTTS.pdf

Аватара пользователя
wasyaka
V.I.P.

Обсуждение и ссылки

#18

Сообщение wasyaka »

S-a-b писал(а):
04 апр 2021 12:20
Писал скрипт на питоне, апк собрать не получилось, вернее, все собирается, и падает. Но в том же Pydroid3 работает хорошо
Это для Андрюши, а для винды?

Аватара пользователя
S-a-b
Обыватель

Обсуждение и ссылки

#19

Сообщение S-a-b »

[quote=wasyaka post_id=6229 time=1618932252 user_id=71]
Это для Андрюши, а для винды?
[/quote]Да, для Windows не подойдет. Разве, что через эмулятор. Можно, наверное, переписать, чтобы запускался на винде и линуксе, при условии, что все зависимости будут установлены, тока оно кому-то надо?

Аватара пользователя
Okey
Интересующийся

Обсуждение и ссылки

#20

Сообщение Okey »

Добрый день.
В последней версии Балаболки при введении STR-файла для он-лайн синтеза речи Гугл Клауд ТТС теперь требуется вводить API ключ.
Где его взять?

Аватара пользователя
balabolka
V.I.P.

Обсуждение и ссылки

#21

Сообщение balabolka »

Okey писал(а):
22 апр 2021 14:44
В последней версии Балаболки при введении STR-файла для он-лайн синтеза речи Гугл Клауд ТТС теперь требуется вводить API ключ. Где его взять?
Сервис синтеза речи от Google всегда был платным. Но существовали два способа пользоваться некоторыми голосами этого сервиса бесплатно; эти два способа по-прежнему доступны в "Балаболке". Применяйте их, как и прежде.

Платный сервис Google Cloud Text-To-Speech доступен по этой ссылке. Зарегистрируйтесь в "облаке" (нужен аккаунт в почте Gmail), и Вам зачислят $300 на Ваш виртуальный счет. Деньги можно потратить в течении трех месяцев тестового периода.

В консоли "облака" создайте пустой проект, активируйте сервис синтеза речи (в разделе "API Library") и создайте API-ключ (в разделе "Credentials"). Всё, можно начать использовать платный сервис. Когда пробный период завершится, Google предложит активировать платную подписку; сами решайте, соглашаться или нет.

Аватара пользователя
Okey
Интересующийся

Обсуждение и ссылки

#22

Сообщение Okey »

Уф, как все сложно стало ) Хорошо, успел кой-что озвучить англ. диктором до введения этого API. Но и сейчас - нашел! - некоторые закладки хорошо озвучивают без заморочек с API
Огромное Вам спасибо! Потрясающая прога!

Аватара пользователя
wasyaka
V.I.P.

Обсуждение и ссылки

#23

Сообщение wasyaka »

S-a-b писал(а):
21 апр 2021 17:42
для Windows не подойдет.
Чтото у меня и на Андрюше не ОК...
открывается в виде тхт...
Redmi 7A
Версия Андроид 10 QKQ1....
Pydroid 3 установил...

Аватара пользователя
Okey
Интересующийся

Обсуждение и ссылки

#24

Сообщение Okey »

IBM Английский (Великобритания) Джеймс V3 - на коротких видео до 5 мин, работает.
Длинные видосы около 10 мин. все время выскакивает ошибка

Аватара пользователя
wasyaka
V.I.P.

Обсуждение и ссылки

#25

Сообщение wasyaka »

wasyaka писал(а):
03 май 2021 19:55
Чтото у меня и на Андрюше не ОК...
Установилось только на скаченный с плей маркета, скаченный с 4pda - не прокатило...

Аватара пользователя
Primkray
Обыватель

Обсуждение и ссылки

#26

Сообщение Primkray »

ЦРТ добавили новые голоса, теперь у них 10 голосов: Даша, Александр, Анна, Виктория, Владимир, Галина, Мария, Михаил, Петр, Юлия.
https://cloud.speechpro.com/service/tts

Аватара пользователя
balabolka
V.I.P.

Обсуждение и ссылки

#27

Сообщение balabolka »

"У нее прекрасное имя: Галя!" - "И, что примечательно, редкое."

Что примечательно, теперь все голоса на основе нейронных сетей (DNN). Обычные голоса убрали.

Ответить

Вернуться в «Онлайн-сервисы для синтеза речи»