<?xml version="1.0" encoding="UTF-8"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<link rel="self" type="application/atom+xml" href="https://mytts.info/app.php/feed/topic/65" />

	<title>MyTTS</title>
	<subtitle>Форум о преобразовании текста в речь</subtitle>
	<link href="https://mytts.info/index.php" />
	<updated>2018-06-21T21:08:20+03:00</updated>

	<author><name><![CDATA[MyTTS]]></name></author>
	<id>https://mytts.info/app.php/feed/topic/65</id>

		<entry>
		<author><name><![CDATA[evmir_troll-hunter]]></name></author>
		<updated>2018-06-21T21:08:20+03:00</updated>

		<published>2018-06-21T21:08:20+03:00</published>
		<id>https://mytts.info/viewtopic.php?t=65&amp;p=71#p71</id>
		<link href="https://mytts.info/viewtopic.php?t=65&amp;p=71#p71"/>
		<title type="html"><![CDATA[Словарь коррекции текста]]></title>

		
		<content type="html" xml:base="https://mytts.info/viewtopic.php?t=65&amp;p=71#p71"><![CDATA[
<div class="inline-attachment"><dl class="file"><dt class="attach-image"><img src="https://mytts.info/download/file.php?id=242" class="postimage" alt="corr1.jpg" onclick="viewableArea(this);" /></dt></dl></div><br>Дополнительный словарь к основному словарю замен, корректирующий текст для лучшей расстановки ударений.<br><br> <img class="smilies" src="./images/smilies/download.gif" width="22" height="23" alt=":download:" title="эмоция"> <a href="https://mytts.info/files/alyona/Dics/corector_alyona.7z" class="postlink" target="_blank" rel="noopener noreferrer"><span style="color:#ff0000">Словарь коррекции текста</span></a><br><br> <img class="smilies" src="./images/smilies/gcopyr.gif" width="22" height="23" alt=":gcopyr:" title="copyright"> <strong class="text-strong">evilone</strong><br><br>Словарь содержит правила на основе регулярных выражений, и предназначен для работы в TTS-программах при чтении и записи в аудиофайл текстовых файлов с использованием пакетов речевых функций SAPI4\SAPI5.<br><br>В зависимости от нужных функций в словаре предусмотрен расширенный выбор правил. Для исключения нужного правила используйте символ #(решетка) в начале нужной строки.<hr><strong class="text-strong">Для лучшей расстановки замен в программе Балаболка в настройках нужно выбрать опцию "<em class="text-italics">Применять правила к большим по размеру частям текста</em>"</strong><br><br><hr><strong class="text-strong">Особенности словаря:</strong><ol style="list-style-type:decimal"><li>Ошибки распознавания текста. Используется для текста содержащего латинские буквы одинаковые по начертанию с кириллицей. Данное правило существенного замедляет работу для большого по объему текста.</li><li>Замена звездочек паузой.</li><li>Удаление лишних звездочек в тексте. Все разделители в тексте, как правило, три звездочки можно заменить паузой, все остальные удаляется правилом.</li><li>Удаление ссылок и html-мусора в тексте.</li><li>Замена тире и дефиса.</li><li>Дубликаты символов. Данное правило удаляет более одного идущего подряд символа для любителей злоупотреблять в тексте конструкциями вида: «---------------------», «===========», «!!!???» и т.п.</li><li>Удаление букв через дефис в словах, напр. Ура-а-а-а! А-а-а-а! и т.п.</li><li>Разрыв строки внутри абзаца. Удаляет переносы строк внутри абзаца. Актуально для текста обработанного программой Книгодел. Аналогична функциям форматирования текста в программах Балаболка и Демагог.</li><li>Замена нескольких пустых строк одной. Удаляет лишние пустые строки в тексте.</li><li>Удаление текста в скобках {}[]&lt;&gt;. Для использования в тексте SAPI4\SAPI5 тегов данное правило необходимо закомментировать.</li><li>Удаление более одного пробела. Удаляет в тексте лишние пробелы.</li><li>Пробел между буквой и цифрой. Корректирует правильную расстановку пробелов между буквой и цифрой согласно правилам набора текста.</li><li>Пробел между буквой и знаком препинания. Корректирует правильную расстановку пробелов возле знаков препинания согласно правилам набора текста.</li><li>Коррекция ошибок произношения. Правила для исправления ошибок произношения.</li><li>Коррекция произношения слов с частицей "-то" образующей особые формы слов.</li><li>Коррекция ошибок произношения при произношении сложносоставных слов с числительными вида 123слово.</li></ol><strong class="text-strong">Несколько важных (системных) правок на примерах</strong>:<br> <img class="smilies" src="./images/smilies/adobe.png" width="32" height="32" alt=":pdf icon:" title="эмоция"> <a href="https://mytts.info/files/docs/fix_corr.pdf" class="postlink" target="_blank" rel="noopener noreferrer"><span style="color:#ff0000">Исправления</span></a><br><br><hr>По определённой причине словарь обновляться не будет.<br><br><br><hr>Из моего давнего письма к <strong class="text-strong">evilone_</strong>:<blockquote class="uncited"><div>Проблема; некоторые омографы с 1-й прописной буквой не ассоциируются с омо-лексом! Это касается не только фамилий – "<strong class="text-strong">ТолстОй</strong>" и "<strong class="text-strong">ДалИ</strong>", но и других словоформ напр. "<strong class="text-strong">ЧумА/ЧУма</strong>".<br>Почему-то для Алёны "<strong class="text-strong">чумА</strong>", "<strong class="text-strong">чУма</strong>", "<strong class="text-strong">ЧумА</strong>", "<strong class="text-strong">ЧУма</strong>" совершенно разные слова.<br> <br>Дублирование таких форм в лексикон омографов считаю неправильным – вместо 2 вариантов слова будет 4,. Лекс превратится в долгооткрывающийся фолиант!</div></blockquote>поэтому позже в корректоре появились правила "<em class="text-italics">убивающие</em>" прописные литеры. <img class="smilies" src="./images/smilies/gun.gif" width="49" height="23" alt=":gun:" title="эмоция"> <div class="spoilwrapper" style="margin:1em 0;font-weight:normal;padding:4px 10px;background-color:#fff;border:1px solid #dbdbdb;border-radius:4px;color:#333"><div class="spoiltitle" style="margin:0;padding:0;width:100%"><span class="spoilbtn" style="margin:2px 5px;text-transform:uppercase;font-family:'Helvetica Neue',Helvetica,Arial,sans-serif;font-size:11px;font-weight:bold;display:block;cursor:pointer;color:#333" data-show="► Показать" data-hide="▼ Скрыть">► Показать</span></div><div class="spoilcontent" style="color:#333;display:none;padding:5px;border-top:1px solid #ccc"><div class="codebox"><p>CODE: </p><pre><code># 12.4. Коррекция букв в словах кроме аббревиатур (если будет медленно, закомментировать все ниже)#А-Я@\b[А]([^А-ЯЁ\d]+)=а$1@\b[Б]([^А-ЯЁ\d]+)=б$1@\b[В]([^А-ЯЁ\d]+)=в$1@\b[Г]([^А-ЯЁ\d]+)=г$1@\b[Д]([^А-ЯЁ\d]+)=д$1@\b[Е]([^А-ЯЁ\d]+)=е$1@\b[Ё]([^А-ЯЁ\d]+)=ё$1@\b[Ж]([^А-ЯЁ\d]+)=ж$1@\b[З]([^А-ЯЁ\d]+)=з$1@\b[И]([^А-ЯЁ\d]+)=и$1@\b[Й]([^А-ЯЁ\d]+)=й$1@\b[К]([^А-ЯЁ\d]+)=к$1@\b[Л]([^А-ЯЁ\d]+)=л$1@\b[М]([^А-ЯЁ\d]+)=м$1@\b[Н]([^А-ЯЁ\d]+)=н$1@\b[О]([^А-ЯЁ\d]+)=о$1@\b[П]([^А-ЯЁ\d]+)=п$1@\b[Р]([^А-ЯЁ\d]+)=р$1@\b[С]([^А-ЯЁ\d]+)=с$1@\b[Т]([^А-ЯЁ\d]+)=т$1@\b[У]([^А-ЯЁ\d]+)=у$1@\b[Ф]([^А-ЯЁ\d]+)=ф$1@\b[Х]([^А-ЯЁ\d]+)=х$1@\b[Ц]([^А-ЯЁ\d]+)=ц$1@\b[Ч]([^А-ЯЁ\d]+)=ч$1@\b[Ш]([^А-ЯЁ\d]+)=ш$1@\b[Щ]([^А-ЯЁ\d]+)=щ$1@\b[Ъ]([^А-ЯЁ\d]+)=ъ$1@\b[Ы]([^А-ЯЁ\d]+)=ы$1@\b[Ь]([^А-ЯЁ\d]+)=ь$1@\b[Э]([^А-ЯЁ\d]+)=э$1@\b[Ю]([^А-ЯЁ\d]+)=ю$1@\b[Я]([^А-ЯЁ\d]+)=я$1</code></pre></div></div></div><p>Статистика: Добавлено  <a href="https://mytts.info/memberlist.php?mode=viewprofile&amp;u=48">evmir_troll-hunter</a> — 21 июн 2018 21:08</p><hr />
]]></content>
	</entry>
	</feed>
