Страница 1 из 1

[FAQ] Можно ли использовать синтез речи в роликах на YouTube?

Добавлено: 26 июн 2018 17:56
balabolka
Очень часто мне задают вопрос, можно ли использовать звуковые файлы, записанные в "Балаболке", для роликов на YouTube (с их последующей монетизацией). Обычно даю такой ответ: сама программа "Балаболка" бесплатная, так что можно записывать в ней любые аудиофайлы, для чего угодно; но разрешение на коммерческое использование компьютерной речи надо получать у разработчиков речевого движка.

Недавно нашел хорошую ссылку на эту тему:
Good quality TTS voices for commercial use
Человек с ником "ForumGuru" рассказал о том, как он контактировал с компаниями, которые разрабатывают синтезаторы речи, и просил разрешить коммерческое использование голосов. Текст на английском, поэтому кратко перескажу по-русски.
  • NeoSpeech: голоса только для личного пользования; использование голоса в трансляциях на YouTube стоит $950 в год.
  • Ivona: только для личного пользования; использование на YouTube - $650 в год.
  • Cepstral: только для личного пользования; использование на YouTube - $1200 в год.
  • Cerepoc: только для личного пользования; коммерческая лицензия - 99 фунтов в год, использование в трансляциях на YouTube - 395 фунтов в год.
В общем, тенденция очевидна. Голоса только для личного пользования; за любую попытку публичного использования записанных звуковых файлов надо платить большие деньги.

Как вариант, можно использовать онлайн-сервисы вроде Amazon Polly, iSpeech.org или Яндекс SpeechKit. Пользователь платит деньги за конвертацию текста в речь, и полученный файл можно использовать в коммерческих целях без ограничений.
  • Amazon Polly: $4 за 1 миллион символов (в течение первого года 5 миллионов символов в месяц бесплатно).
  • iSpeech.org: $500 за 10000 слов.
  • Яндекс SpeechKit Cloud: 20 копеек за один запрос на синтез (один запрос равен 20 секундам).