<?xml version="1.0" encoding="UTF-8"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<link rel="self" type="application/atom+xml" href="https://mytts.info/app.php/feed/topic/425" />

	<title>MyTTS</title>
	<subtitle>Форум о преобразовании текста в речь</subtitle>
	<link href="https://mytts.info/index.php" />
	<updated>2020-12-02T11:13:52+03:00</updated>

	<author><name><![CDATA[MyTTS]]></name></author>
	<id>https://mytts.info/app.php/feed/topic/425</id>

		<entry>
		<author><name><![CDATA[Lecron]]></name></author>
		<updated>2020-12-02T11:13:52+03:00</updated>

		<published>2020-12-02T11:13:52+03:00</published>
		<id>https://mytts.info/viewtopic.php?t=425&amp;p=5067#p5067</id>
		<link href="https://mytts.info/viewtopic.php?t=425&amp;p=5067#p5067"/>
		<title type="html"><![CDATA[Новости]]></title>

		
		<content type="html" xml:base="https://mytts.info/viewtopic.php?t=425&amp;p=5067#p5067"><![CDATA[
Развитие TTS технологий вне проприетарных сервисов, таки продолжается.<br><a href="https://m.habr.com/ru/company/ashmanov_net/blog/528296/" class="postlink" target="_blank" rel="noopener noreferrer">Open Source синтез речи SOVA / Хабр</a>.<br>В комментариях утверждается, что качество даже получше Google TTS. Шанс на появление современных десктопных движков еще немного вырос.<p>Статистика: Добавлено  <a href="https://mytts.info/memberlist.php?mode=viewprofile&amp;u=57">Lecron</a> — 02 дек 2020 11:13</p><hr />
]]></content>
	</entry>
		<entry>
		<author><name><![CDATA[Lecron]]></name></author>
		<updated>2019-03-02T09:45:05+03:00</updated>

		<published>2019-03-02T09:45:05+03:00</published>
		<id>https://mytts.info/viewtopic.php?t=425&amp;p=1776#p1776</id>
		<link href="https://mytts.info/viewtopic.php?t=425&amp;p=1776#p1776"/>
		<title type="html"><![CDATA[Новости]]></title>

		
		<content type="html" xml:base="https://mytts.info/viewtopic.php?t=425&amp;p=1776#p1776"><![CDATA[
Интересно, когда программа сама сможет готовить себе датасет? Указываем папку аудиокниги, указываем ее текстовый файл, жмем кнопку "Создать голос", а программа сама, по анализу пауз и темпа навязываемого знаками препинания, привязывает одно к другому и формирует датасет. И вот мы, промозглым весенним вечером, сидя у камина с бокалом пунша в руке, слушаем книгу, озвученную голосом известного исторического персонажа или любимого артиста.<br>Да, я знаю, что новость про наборы для тренировки распознавания, но мечтать-то не вредно.<hr><br><br><span style="font-size:85%;line-height:116%"><span style="color:green">Отправлено спустя    16 часов 40 минут 13 секунд:</span></span><br>Понравились комменты на <a href="http://www.opennet.ru/opennews/art.shtml?num=50229" class="postlink" target="_blank" rel="noopener noreferrer"> opennet</a>.<br>Что не так с речью в Мозилле<div class="spoilwrapper" style="margin:1em 0;font-weight:normal;padding:4px 10px;background-color:#fff;border:1px solid #dbdbdb;border-radius:4px;color:#333"><div class="spoiltitle" style="margin:0;padding:0;width:100%"><span class="spoilbtn" style="margin:2px 5px;text-transform:uppercase;font-family:'Helvetica Neue',Helvetica,Arial,sans-serif;font-size:11px;font-weight:bold;display:block;cursor:pointer;color:#333" data-show="► Показать" data-hide="▼ Скрыть">► Показать</span></div><div class="spoilcontent" style="color:#333;display:none;padding:5px;border-top:1px solid #ccc"><blockquote class="uncited"><div>Common Voice:<br><br>1) собираются голоса молодых людей мужского пола 20-30 лет, нет женских, детских, нет голосов старшего возраста.<br>2) тексты для записи ограничены тысячей предложений, нет вариативности словаря, в дальнейшем будут трудности со словами.<br>3) записи распространяются в mp3, что вносит искажения в голосовой сигнал. Оригиналы не дают, видимо, не хотят конкуренции.<br>4) традиционно вместо того, чтобы развивать существующий проект (voxforge) запилили свой.<br>5) проверка записей делается вручную, хотя может делаться автоматическими средствами.<br>6) сейчас таких данных можно просто накачать с youtube за пару часов в 10 раз больше, чем они собрали за год для всех языков.<br><br>DeepSpeech<br><br>1) взяли чужую технологию от Baidu<br>2) за пару лет ничего не сделали, даже не добились нормальной точности, точность гораздо хуже передовых результатов.<br>3) зато кричат о себе на всех углах, получили европейский грант<br>4) когда стало поджимать, скопировали втихушку чужую библиотеку libctcdecode, не упомянув автора, выкинув весь свой предыдущий код<br>5) декодер всё ещё требует 4гб памяти, работает очень медленно<br>7) в коммитах бесконечно переделывают справку и конфигурационные файлы, ни одного реального улучшения. ну ещё обертки для языков пишут<br>8) модели не может натренировать простой любитель, нужен суперкомпьютер с 8 GPU<br><br>В итоге этот проект недалеко ушёл от предыдущего (мобильной ОС) </div></blockquote></div></div>Ну и по синтезу (mozilla/TTS)<div class="spoilwrapper" style="margin:1em 0;font-weight:normal;padding:4px 10px;background-color:#fff;border:1px solid #dbdbdb;border-radius:4px;color:#333"><div class="spoiltitle" style="margin:0;padding:0;width:100%"><span class="spoilbtn" style="margin:2px 5px;text-transform:uppercase;font-family:'Helvetica Neue',Helvetica,Arial,sans-serif;font-size:11px;font-weight:bold;display:block;cursor:pointer;color:#333" data-show="► Показать" data-hide="▼ Скрыть">► Показать</span></div><div class="spoilcontent" style="color:#333;display:none;padding:5px;border-top:1px solid #ccc"><blockquote class="uncited"><div>1) Опять скопировали чужой проект на github, назвали своим. Автору пришлось напоминать <a href="https://github.com/mozilla/TTS/issues/2" class="postlink" target="_blank" rel="noopener noreferrer">https://github.com/mozilla/TTS/issues/2</a><br>2) Куча хороших проектов на тему существует, до сих пор пилят "своё". Потихоньку копируют, что другие сделали, например, Tacotron2 внесли (скопировали) только сегодня, сходимость моделей была никакая.<br>3) Wavenet так и не добавили. </div></blockquote></div></div><p>Статистика: Добавлено  <a href="https://mytts.info/memberlist.php?mode=viewprofile&amp;u=57">Lecron</a> — 02 мар 2019 09:45</p><hr />
]]></content>
	</entry>
		<entry>
		<author><name><![CDATA[good_cat]]></name></author>
		<updated>2019-03-01T13:14:08+03:00</updated>

		<published>2019-03-01T13:14:08+03:00</published>
		<id>https://mytts.info/viewtopic.php?t=425&amp;p=1775#p1775</id>
		<link href="https://mytts.info/viewtopic.php?t=425&amp;p=1775#p1775"/>
		<title type="html"><![CDATA[Новости]]></title>

		
		<content type="html" xml:base="https://mytts.info/viewtopic.php?t=425&amp;p=1775#p1775"><![CDATA[
Русский язык тоже планируется... позже.<br><div class="spoilwrapper" style="margin:1em 0;font-weight:normal;padding:4px 10px;background-color:#fff;border:1px solid #dbdbdb;border-radius:4px;color:#333"><div class="spoiltitle" style="margin:0;padding:0;width:100%"><span class="spoilbtn" style="margin:2px 5px;text-transform:uppercase;font-family:'Helvetica Neue',Helvetica,Arial,sans-serif;font-size:11px;font-weight:bold;display:block;cursor:pointer;color:#333" data-show="► Показать" data-hide="▼ Скрыть">► Показать</span></div><div class="spoilcontent" style="color:#333;display:none;padding:5px;border-top:1px solid #ccc"><div class="inline-attachment"><dl class="file"><dt class="attach-image"><img src="https://mytts.info/download/file.php?id=564" class="postimage" alt="RusLang.png" onclick="viewableArea(this);" /></dt></dl></div></div></div><p>Статистика: Добавлено  <a href="https://mytts.info/memberlist.php?mode=viewprofile&amp;u=50">good_cat</a> — 01 мар 2019 13:14</p><hr />
]]></content>
	</entry>
		<entry>
		<author><name><![CDATA[tonio_k]]></name></author>
		<updated>2019-03-01T11:27:11+03:00</updated>

		<published>2019-03-01T11:27:11+03:00</published>
		<id>https://mytts.info/viewtopic.php?t=425&amp;p=1774#p1774</id>
		<link href="https://mytts.info/viewtopic.php?t=425&amp;p=1774#p1774"/>
		<title type="html"><![CDATA[Новости]]></title>

		
		<content type="html" xml:base="https://mytts.info/viewtopic.php?t=425&amp;p=1774#p1774"><![CDATA[
Что восхитило, так это при выборе языка нет русского, зато есть чувашский!  <img class="smilies" src="./images/smilies/bqa.gif" width="43" height="27" alt=":hi:" title="эмоция"> <div class="spoilwrapper" style="margin:1em 0;font-weight:normal;padding:4px 10px;background-color:#fff;border:1px solid #dbdbdb;border-radius:4px;color:#333"><div class="spoiltitle" style="margin:0;padding:0;width:100%"><span class="spoilbtn" style="margin:2px 5px;text-transform:uppercase;font-family:'Helvetica Neue',Helvetica,Arial,sans-serif;font-size:11px;font-weight:bold;display:block;cursor:pointer;color:#333" data-show="► Показать" data-hide="▼ Скрыть">► Показать</span></div><div class="spoilcontent" style="color:#333;display:none;padding:5px;border-top:1px solid #ccc"><div class="inline-attachment"><dl class="file"><dt class="attach-image"><img src="https://mytts.info/download/file.php?id=563" class="postimage" alt="Screenshot_20190301-112228.png" onclick="viewableArea(this);" /></dt></dl></div></div></div>Вот даже не знаю что это значит и какова история такого решения <img class="smilies" src="./images/smilies/suspect.gif" width="20" height="29" alt=":suspect:" title="эмоция"><p>Статистика: Добавлено  <a href="https://mytts.info/memberlist.php?mode=viewprofile&amp;u=51">tonio_k</a> — 01 мар 2019 11:27</p><hr />
]]></content>
	</entry>
		<entry>
		<author><name><![CDATA[good_cat]]></name></author>
		<updated>2019-03-01T11:04:54+03:00</updated>

		<published>2019-03-01T11:04:54+03:00</published>
		<id>https://mytts.info/viewtopic.php?t=425&amp;p=1772#p1772</id>
		<link href="https://mytts.info/viewtopic.php?t=425&amp;p=1772#p1772"/>
		<title type="html"><![CDATA[Новости]]></title>

		
		<content type="html" xml:base="https://mytts.info/viewtopic.php?t=425&amp;p=1772#p1772"><![CDATA[
В рамках проекта Common Voice Mozilla выпустила открытый датасет из записей человеческой речи на 18 языках, в том числе на немецком, французском, китайском и испанском. Общая длительность записей превышает 1300 часов. Компания планирует использовать набор данных в своих движках и предоставляет его всем желающим.<br><br><a href="https://voice.mozilla.org/en/datasets" class="postlink" target="_blank" rel="noopener noreferrer">https://voice.mozilla.org/en/datasets</a><p>Статистика: Добавлено  <a href="https://mytts.info/memberlist.php?mode=viewprofile&amp;u=50">good_cat</a> — 01 мар 2019 11:04</p><hr />
]]></content>
	</entry>
	</feed>
