<?xml version="1.0" encoding="UTF-8"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<link rel="self" type="application/atom+xml" href="https://mytts.info/app.php/feed/topic/66" />

	<title>MyTTS</title>
	<subtitle>Форум о преобразовании текста в речь</subtitle>
	<link href="https://mytts.info/index.php" />
	<updated>2018-06-21T22:28:37+03:00</updated>

	<author><name><![CDATA[MyTTS]]></name></author>
	<id>https://mytts.info/app.php/feed/topic/66</id>

		<entry>
		<author><name><![CDATA[evmir_troll-hunter]]></name></author>
		<updated>2018-06-21T22:28:37+03:00</updated>

		<published>2018-06-21T22:28:37+03:00</published>
		<id>https://mytts.info/viewtopic.php?t=66&amp;p=72#p72</id>
		<link href="https://mytts.info/viewtopic.php?t=66&amp;p=72#p72"/>
		<title type="html"><![CDATA[Лексикон омографов]]></title>

		
		<content type="html" xml:base="https://mytts.info/viewtopic.php?t=66&amp;p=72#p72"><![CDATA[
<div class="inline-attachment"><dl class="file"><dt class="attach-image"><img src="https://mytts.info/download/file.php?id=241" class="postimage" alt="omograph_lex.jpg" onclick="viewableArea(this);" /></dt></dl></div><br> <img class="smilies" src="./images/smilies/download.gif" width="22" height="23" alt=":download:" title="эмоция"> <a href="https://mytts.info/files/alyona/Lexes/omograph_lex.7z" class="postlink" target="_blank" rel="noopener noreferrer"><span style="color:#ff0000">Лексикон омографов</span></a><br><br><em class="text-italics">Редакция</em>: <strong class="text-strong">evilone, E. Miroshnychenko</strong><br><br>Завершена работа по исправлению и дополнению лексикона омографов. Спасибо <strong class="text-strong">evilone </strong>за помощь, и <strong class="text-strong">И. Морозову</strong> за создание <a href="http://www.cross-plus-a.com/util/txt2hmg.zip" class="postlink" target="_blank" rel="noopener noreferrer"><span style="color:#FF0000">Txt2hmg</span></a> - утилиты, преобразующей список омографов в список правил <a href="https://mytts.info/files/docs/dics/omoforms/total_omoforms.7z" class="postlink" target="_blank" rel="noopener noreferrer"><em class="text-italics"><span style="color:#FF0000">total_omoforms.hmg</span></em></a> для "<em class="text-italics">ручного</em>" поиска омографов в тексте.<br><br><strong class="text-strong">Что сделано</strong>:<ol style="list-style-type:decimal"><li>Определены грамматические атрибуты</li><li>Исправлена орфография</li><li>Удалены НЕ омографы</li><li>Добавлены омографы + падежные формы к уже существующим</li><li>Добавлены <em class="text-italics"><strong class="text-strong">клитики</strong></em> - ударные словосочетания:<br><strong class="text-strong">зАруку<br>нАногу<br>пОполу</strong><br>и т.д. (граммат. атрибут для таких слов – <em class="text-italics">DETERMINER</em>)</li><li>Прослушано в <strong class="text-strong">Балаболке</strong>, <strong class="text-strong">Демагоге</strong>, <strong class="text-strong">Mp3book2005</strong> и <strong class="text-strong">TextAloud</strong>, исправлены транскрипции.</li><li>Рекомендуется подключать 1-м по приоритету</li></ol><strong class="text-strong">Методика</strong>:<br>Список транскрипций импортирован в новый лекс, который был затем подключён единственным к новообразованному голосу на основе <strong class="text-strong">Alyona Acapela</strong>. <br>Список омографов вставлен в TTS программу для вычитывания.<br>После каждого слова в списке проставлена точка с запятой ;<br><br><strong class="text-strong">Анализ</strong>:<br>Вычитывание омографов показала основной недостаток правки слов лишь в <em class="text-italics">Lexicon Manager</em>; в Manager’е словоформа может звучать абсолютно правильно, а в TTS программах нет. Таких форм ок. 3 тысяч. Если добавить 3000 удалённых форм, то понятно, что десятая часть лексикона не работала(!)<br><br>Прослушивать нужно в контексте. Если в TTS программу вставить список, и после каждого слова проставить точку с запятой (для необходимой паузы), то возникает эффект "<em class="text-italics">почти</em>" контекста.<br><br><strong class="text-strong">Вывод</strong>:<br>Важен контекст.<br>Вычитывание только в обычных TTS-п. (они для этого и предназначены). <img class="smilies" src="./images/smilies/wink.gif" width="18" height="18" alt=":wink:" title="эмоция"> <br>Разница в звучании на разных программах ничтожна - достаточно немного подправить транскрипцию для одной, чтоб слово произносилось верно в других.<br><br><hr>Есть уверенность, что довольно много омо в своём изначальном, текстовом варианте (<strong class="text-strong">без</strong> капслоков) могут произноситься неправильно. Напр. "<em class="text-italics">души</em>", <em class="text-italics">"стою"</em> (звучит "<em class="text-italics">стая</em>"), а перед запятой становятся проблемными слова: "<em class="text-italics">цели</em>" (звучит <em class="text-italics">целя</em>), "<em class="text-italics">стороны</em>" (ударение на "ро"), <br>Нужно просто выбрать более частый вариант и всё нормализуется.<br><hr>Как бы не редактировались/разделялись/пополнялись правила в словаре(рях) замен, никогда <span style="color:red">НЕ</span> удастся охватить даже несколько процентов всех возможных словосочетаний! И в огромном количестве предложений будут присутствовать неизменённые омографы с непредсказуемым звучанием в зависимости от контекста, знака пунктуации или ещё чего.<br>Поэтому рекомендуется использовать <a href="https://mytts.info/viewtopic.php?f=4&amp;t=67" class="postlink" target="_blank" rel="noopener noreferrer"><span style="color:#ff0000">Частотный лексикон</span></a> - он основательно дополнен. Подключается 2-м по приоритету.<br><br><br><hr>Я завершил редактирование омо-лекса в конце 12г. но омоформы всё лезут и лезут. <img class="smilies" src="./images/smilies/zombie.gif" width="35" height="22" alt=":zombie:" title="эмоция">  Это будет бесконечно...<br>Есть и эдакое:<br><strong class="text-strong"><span style="color:#00c800">о=о,О<br>во=во,вО<br>до=до,дО<br>ко=ко,кО<br>по=по,пО<br>под=под,пОд</span></strong><br><br>Есть разница в звучании\восприятии фраз:<br><em class="text-italics"><span style="color:#ff0000">о чём? во дворе. до вас. ко мне. по плечу. под столом</span>.</em><br> <br>и:<br><span style="color:#ff0000">О, боже! вО вО. нота дО. курочка кО-кО-кО. река пО. печной пОд или пОд печи.</span><br> <br>В первом случае выраженная фонема "а", во втором - чёткая "о".<br>Интересно ваше мнение... считаются ли такие слова омографами, и стоит ли их прописывать в словарях\лексиконах?<p>Статистика: Добавлено  <a href="https://mytts.info/memberlist.php?mode=viewprofile&amp;u=48">evmir_troll-hunter</a> — 21 июн 2018 22:28</p><hr />
]]></content>
	</entry>
	</feed>
