Я так понял, Stereo Mix в виндовс изначально по умолчанию отключен. А без этого программы не хотят писать звук идущий со звуковой карты на колонки. После того как я его включил то запустив фильм в КМплеере и включив прогу например: Audio Record Expert записал одновременно все звуки и из фильма и чтение Аленки. Осталось только прикрепить эту дорожку к фильму например в VirtualDubMod (за 5 минут). У меня правда получилось к концу фильма пару секунд рассинхрона. Пришлось подгонять. В КМплеере перемотка работает с субтитрами так что в abmsubtitlesreader надобность отпала. Спасибо за помощь.
Друзья, а может ли кто-нибудь сделать мощный генератор падежей, работающий по типу acatts через батник, командную строку и т.д. Не секрет, что Алена может читать некоторые слова хорошо только в именительном падеже, а в других плохо. Напр. слово «волейболист» звучит нормально, а «волейболисте» нет. И наоборот, «контрбатман» читается неверно, а его падежи – отлично. Но невозможно вручную переделывать сотни слов в другие падежи. На это не хватит никакого терпения. Касательно же "Генератора падежных окончаний" v.0.8.7, то это скорее для первоклассников, ведь он работает только с одним словом. Есть онлайн-генератор падежей для группы слов здесь: http://morphology.ru/ но требуется естественно подключение к интернету. Нужен такой генератор, чтобы без интернета загрузить в него список слов, и на выходе получить список падежей. Пускай с ошибками, их можно потом подправить. Если такая программа уже существует, то дайте пожалуйста ссылочку, если же нет – нужно обязательно сделать! Ведь сделали же text parser, acatts и т.д. Таким образом можно будет осуществить колоссальный прорыв в ускорении работы над словарями. С помощью text parser формируем список, потом мощный генератор падежей дописывает падежные окончания, затем запускаем KeySpeaker, и прослушиваем – правильные слова удаляем, из неправильных acatts делает транскрипции, импортируем их в Lexicon manager и там правим. Красота!
evmir1 Дело в том, что движки и Алёна, и Олга построены по принцыпу "ударение в корневом слоге" по ходу дела, в зтих движках тоже пытались сделать ударения на предлоги и окончания по статистическому методу, и получили, что имеем...
Цитата :
Но невозможно вручную переделывать сотни слов в другие падежи. На это не хватит никакого терпения
Для этого есть словари - типа Зализняка, только надо их проредить. Для этого тоже терпение нужно. Из 3Olgazalizn_olga я выташил около 128 000 слов, и зто не предел, хотя с ним крепко поработал Stroodder. Для падежей и склонений есть такая штука (читать надо старинные топики) MorphWizard http://aot.ruСкачать "MorphWizard: Система редактирования морфологических словарей"
Цитата :
Пускай с ошибками, их можно потом подправить
Без ошибок, править тоже можно. Я исползую его/её в своих программах, очень удобно. Тем более,что в бинарник генерится, ну как Зализняк. Как вписатся туда, чтобы редактировать, наверное вопросов не будет. Вообще то я, сгоряча, раньше пользовался словарями ( а особенно 0omograph.dic) для Ольги, а потом переводил в Алёну. Они (словари) на два голоса поют более правильно, чем Алёнен (омографы) в один голос. Надо только,кое где, знак "`" убрать - это для Ольги сделано, чтобы в лексикон лишних слов не пихать. Другое дело, что в лексиконе Алёны не все неправильные слова прописаны. P.S. Словарями в чистом виде пользоваться не правильно. Это про словари из читалок. Которые (читалки) писались во времена Николая Елановича. Только "Балаболка" эволюцианирует. Но на словарях далеко не уедешь. Не надо быть Лобачевским, чтобы посчитать, какой словарь омографв должен быть, а ещё деепричастные обораты... Нужно по морфологическим признакам ударения ставить, и в редких случаях "ЗАмок - замОк" по сочитаниям слов. Построение правил в прикладной программе - подобно как в Прологе -прологоподобные. Это Я про омографы. Что касательно обычных слов, то ударения и "Ё"фикация берутся прям из бинарника с ударениями. Другое дело надо убрать ударения, там где не благозвучно слышится(это к Ольге относится) например "аракчеевская и аракче' ^'евская". И ещё полезная вешь - WordTabulator http://bloggreenwood.com/programm/WordTabulator/setup.exe mia плохого не напишет. Читай её топики.
Изначально словарь 0omograph.dic строился для всех голосов, поэтому ударение внём сделано знаком "+" с последуюшем переводом его внужный вид. Практика показала, что удобней обработать текст под голос Ольга, а потом перевести знаки ударения в заглавные буквы. Как готовить текст для Ольги и какие словари подключать и в какой последовательности, там всё подробно прописано. Если готовить текст только для Алёны, то словарь 1Olga_default.dic можно не подключать, хотя и он исправляет многие слова неправильно произносимые Алёной. Для его использования, скрытый текст нужно дополнить такими записями: *е`*=Е, *и`*=И и т.д. Конечно надо дополнить лексикон такими словами, если таковых там нет.
Использую аленку для звуковой сигнализации диспетчеру. Внутри используемой среды нет доступа к апишным функциям и вообще язык программирования очень сильно урезан. но есть возможность запускать приложения, чем и воспользовался:
Внутри используемой среды нет доступа к апишным функциям и вообще язык программирования очень сильно урезан. но есть возможность запускать приложения, чем и воспользовался:
Попробуй Ольгу. там нуочень хороший интефейс к прикладным программам.
Для этого есть словари - типа Зализняка, только надо их проредить. Для этого тоже терпение нужно. Из 3Olgazalizn_olga я выташил около 128 000 слов, и зто не предел, хотя с ним крепко поработал Stroodder. Для падежей и склонений есть такая штука (читать надо старинные топики) MorphWizard http://aot.ruСкачать "MorphWizard: Система редактирования морфологических словарей"
Вы меня не поняли – я пытаюсь научить Алену таким словам как «рефакция, конъюктивный» и т.д. Естественно никакой морф. словарь Зализняка или еще кого, и MorphWizard таких слов не имеет, вот поэтому я и хочу найти программу, автоматически дописывающую падежные окончания к группе слов. Ведь известно, что в русском языке падежи шаблонны и зависят от числа и лица части речи, какое бы слово странным не было. Если это имя существительное в единственном числе, то падежные окончания будут; а у ом е
А если напр. имя прилагательное во множественном числе, то; им ими их
Может какой-либо специалист впишет эти шаблоны в какую-либо программу, и будет людям счастье.
я и хочу найти программу, автоматически дописывающую падежные окончания к группе слов.
Кажется Ажажа выкладывал такой батник,поищу у себя. Но даже выправив все склонения и падежи, в реальном тексте всё равно произношение будет отличаться.
Вы меня не поняли – я пытаюсь научить Алену таким словам как «рефакция, конъюктивный» и т.д. Естественно никакой морф. словарь Зализняка или еще кого, и MorphWizard таких слов не имеет,
Может, я опять не понял. Но эти програмки по иходному слову строят все склонения и спряжения. А по програмному запросу, если указать склонение или спряжение и начальную форму слова, то можно получить нужную форму. Алгоритм длязапросов к Заализняку можно найти в интернете, а для MorphWizard на AOT. В MorphWizard можно через оболочку. Вот что у меня получилось:
Есть ещё какая то подобная програмка сейчас не помню, но если надо, то найду. На сайте С.А.Старостин можно поискать. Чтобы дописывать окончания, такого не найдёте, это точно. Подумайте почему. Эти утверждения верны только отчасти.
Цитата :
Если это имя существительное в единственном числе, то падежные окончания будут; а у ом е
А если напр. имя прилагательное во множественном числе, то; им ими их
evmir1 Почему свою задачу не хотите в Excel решить? Окончания дописываются элементарно. Дам полный список окончаний для всех частей речи (во всех падежах и склонениях), mia делала, за что ей огромное ей спасибо. Только вот славянские языки отличаются от геманских и романских. Поэтому эта затея для русского языка
Цитата :
Ведь известно, что в русском языке падежи шаблонны и зависят от числа и лица части речи, какое бы слово странным не было.
Ну не умею я работать вручную с командной строкой и алгоритмами
Никакой командной строки и алгоритмов не надо. Надо поставить "корень" в ячейки (A1, A34 и сушествительное в A105) и всё. Я писал:
Цитата :
Почему свою задачу не хотите в Excel решить?
Только вот обратите внимание как спрягаются "бегать и бежать"!!! Я не помню как это по рксски называется, когда "г" на "ж" и "у" на "ю" и т.д., заменяется, а с уэбекского это не переводится. Поэтому эта затея весьма проблематична. А иначе, - давно бы такие программы существовали. Надо скачать Morphwizard.exe и стого же сайта http://aot.ru словарь http://aot.ru/download/RusMorph.zip Пароль к словарю: alex (если конечно потребуется, смотреть и так можно). Всё в очень удобном браузере сделанно, и никакой командной строки. Похоже Вы даже и не потрудились заглянуть туда! О чём можно тогда говорить?
P.S. В столбце "окончаний" надо убрать букву "а" (ать, ал, авшим и т.д.) . Спешил, ошибся. А то глаголы на "я" и им подобные неправильно будут склоняться, например "стоять". И писать в красные ячейки уже надо - "стоя".
Спасибо за советы. я скачал Morphwizard.exe и словарь к нему, но там получаешь результат на одно слово, списком они в поле не вставляются. Идея с Excel до меня не дошла, и к сожалению не смог воспользоваться Вашим примером. Архив на http://depositfiles.com/files/884m1rw5f оказался пустым. Я не дружу с Excel, поэтому не могли бы Вы более детально объяснить для особо умного "тормоза", что и как делать. Извините, но не доходит совершенно
В Morphwizard, когда получаем все словоформы интересующего слова, выделяем весь столбик и по ctrl - C запоминаем. Потом вставляем в любой текстовый редактор или Балаболку по ctrl - v. Ненужное убираем. Напримр "нападать" - 1. Написать в строке ввода "нападать". 2. Выбрать "lemma", или -жо "word form" и нажать find 3. На омограф появятся две формы "напа'дать" и "напвда'ть" на обычные слова - одна форма. 4.щёлкаем по выбранной форме, в окне получаем все словоформы.
Объясните, пожалуйста, что Вы имеете в виду под "проверить права доступа к alyona22k.dic"?- "под юзером" или "под админом", проверял - доступ к файлам полный.
Подскажите в чём может быть проблема. В лексикон менеджер в omograph.dic имеются записи слова стОит и стоИт и произносятся правильно. А в Балаболке через словарь омографов выбираю стОит, а читает всё равно - стоИт.
Soyer часто в тексте может стоять многоточие, и Алена перед ним, как правило читает омографы неверно. Просто побробуйте поменять знаки препинания, точку на запятую, и наоборот или многоточие на двоеточие. Если не поможет, то в транскрипции слов стОит и стоИт в ударении поменяйте единицу на двойку, или наоборот
Действительно, не был подключен лексикон. Вернее, он подключен, но почему то не схватился движком.Помогло переподключение лексикона. Правда перед этим пробывал воткнуть лексикон с этими только двумя словами. Возможно это сыграло свою роль.
Посмотрел в Балаболке функцию "Найти имена" и не понял какая польза от кнопок "Добавить в словарь". Возможно это удобно с другими синтезаторами речи (я с ними не знаком), но для Алёнки , по моему, не применимо. Вот если бы в Балаблке была поддержка словарей в формате *.txt, тогда да. Тогда можно было бы перегнать слова, которые произносятся не так как нам хотелось бы, в словарь Не правильно произносимые слова.txt, оттуда в ACATTS, затем в Лексикон менеджер и там править. И создать ещё пару таких же txt словарей, которые будут защищать от повторений при поиске имён, первый - в книгах той же серии, второй - в других книгах. Можно описать подробней и на конкретном примере. Лично мне кажется было бы очень удобно. Но возможно то, что я здесь написал, это полный бред. Возможно в Балаболке это внедрить не возможно или очень сложно. Поэтому хотелось бы услышать мнение знатоков.
"Найти имена" удобно слушать и сразу добавлять их в лексикон возится с ACATTS нету смысла потому что транскрипции все равно будут не правильными и их нужно будет править
Цитата :
словарей, которые будут защищать от повторений при поиске имён
для этого можно создать отдельный словарь вида
Код:
слово=_ слово=_ слово=_
и при каждом новом поиске имен подключать его и включать опцию "не показывать слова из словаря" а после добавлять новые уже добавленные в него и хотя это долго, но зато чем больше тем дальше легче
для балаболки создайте ini словарь с правилом
Код:
([A-Za-zА-я\-|\'|\.|\#|\d]{1,20})\n*=$1=_
и обработайте им быстро список новых имен, тот который экспортируется
а формат словарей dic это тот же txt его можно просто переименовать из txt в dic и будет словарь
С чего вы взяли, что я мучаюсь? Уж думаю на что переходить - я мог бы и сам решить. Никто не спорит, что Алёна на данный момент самый приемлемый вариант. Но тот же Николай был гораздо гибче в плане звучания. Изменяя тембр и скорость, можно было получить весьма сносные голоса, но разные по тональности, что было весьма удобно использовать, например, для диалогов. А вот Алёну, кроме как в стандартном её монотонно-грустном произношении, больше никак не послушаешь. Если слушать маленькими частями, то как-то не обращаешь на это внимания. А если часа эдак четыре подряд этот голос несчастной грустной женщины слушать, то начинает уже на самого тоску наводить, даже если бы она анекдоты травила.
Но тот же Николай был гораздо гибче в плане звучания. Изменяя тембр и скорость, можно было получить весьма сносные голоса, но разные по тональности, что было весьма удобно использовать, например, для диалогов.
У Алёны есть возможность изменить тембр, скорость, паузы - есть даже эквалайзер (это по вопросу о тональности). Всё это находится в Acapela Voice Manager, как с ним работать, написано тут
Это я знаю, менял. Максимальные слушабильные значения -1/+1. Использовать эквалайзер нет смысла, потому что в любом медиа-проигрывателе он есть, да и на сам голос он никак не влияет.
Может кто сталкивался с такой проблемой - устанавливаю голосовой движок, а его система не видит. Файлы посмотрел, на месте, но в системе голосовой движок не определяется. При попытке зайти с лексикон менеджер выскакивает окно the text-to-speech engine could not be initialized. Вот как-то так и голосовой движок в системе вообще не определяется. Переустанавливал несколько раз - то же самое все.
Быть может вам стоит попробовать установить/переустановить сами системные файлы синтеза речи (ms_speech_api.exe, MSagent.exe и тд). У меня ХР и в контрольной панели распознаётся только sapi5, а в читалках есть и sapi5 и sapi4.
Может винда урезанная? Я Алёной не пользуюсь, но когда ставил "семёрку" - то голоса "Ольга" тоже не было видно, при всех возможных телодвижениях. Взлом не помогал. Пока не активизировал голос через attstest.exe (в "Ольге" находиться.), хотя утилита там не рабочая. Видимо в качестве примера приведена. Если стоит семёрка, то чудеса ещё впереди. Я перешёл опять на ХР. Есть достойные сборки ХР, с элементами 7, могу выложить.
P.S. Помню были жалобы, что тот или иной голос не не работает именно на семёрке. Пробовал три версии, одна из них не ворованная, - ни одна не впечатлила. Если магазинная установка, то можно смело всё тереть.
Может это поможет? На другом компе попробовал, где семёрка стоит, - та-же история. Надо зарегистрировать голос в системе.
Цитата :
C:\Program Files\Acapela Group\Infovox Desktop 2.2\VMan.exe Поставить курсор на Alyona22k, нажать ctrl+N, в открывшемся окошке написать название, нажать create и редактировать по своему вкусу Кнопка с дискеткой будет активная в этом новом голосе.
теперь можно выставить все установки, как хочется и сохранить.
P.S. Интересно, почему нельзя редактировать свои сообщения??? Пробовал пример приведённый выше, прошло время... Запрет на редактирование, если он хоть чем то оправдан, надо сделать 24 часа!!!
Проблему удалось разрешить путем замены лицензии. Версия у меня кракнутая, вот там похоже косяк был какой-то в лицензии, после смены ключа все заработало. Система Windows 7.
здравствуйте не могли бы выложить полный конфиг-того чем вы пользуетесь для озвучки текста допустим так: голосовой движок алёна(русский) +какой нибудь английский сама программа балаболка(или какая то другая) словари такие то и установлены в таком то порядке(приоритете)
пишу вам потому что вижу что вы в теме уже давно,а самому разбираться=нужно много времени и не всегда получается хороший результат почему бы не выложить ваши наработки чтобы не профессионалу можно было поставить и пользоваться а уже готовое можно выставлять на конкурс здесь на форуме,в смысле -допустим дан заданный отрывок текста со всевозможными хитростями произношения и т,д, и т, п, тогда результат для разных конфигов(подборкой словарей и всяческих корректоров) можно будет очень быстро оценить на слух и я думаю тогда в этом деле будет больший прогресс чем сейчас когда каждый делает под себя
думаю я более менее понятно описал суть вопроса ответьте будьте добры
самому разбираться=нужно много времени и не всегда получается хороший результат почему бы не выложить ваши наработки чтобы не профессионалу можно было поставить и пользоваться
то о чем вы просите подробно описано в этом топике, ищите свободное время и читайте, там описан самый простой вариант установки и настройки, есть ссылки на словари и инструкции по их установке. а уже если что-то будет непонятно тогда спрашивайте