|
|
Автор | Сообщение | myTTS Subtitles Helper |
---|
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 28.12.12 19:41 |  |
| А сами субтитры чем будут читаться? ABM Subtitles Reader, KMPlayer? KMPlayer, вроде бы, умеет "отбрасывать" специальные теги, читая вслух только сам текст? (Правда, давно уже не пользовался этим плеером; возможно, я ошибаюсь.)
Это Han Hyo Joo на аватарке? |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 28.12.12 21:27 |  |
| balabolka, я их читаю KMPlayer-ом, но наверно можно и тем и тем там отбрасывать можно не столько теги сколько дополнительную информацию например рекламу в начале и\или конце файлов, примечания, перевод песен (очень сильно раздражает) и прочую малополезную информацию при прослушивании иногда звучит много лишней информации которая отвлекает от просмотра да и если субтитров много то вручную их преобразовывать очень долго получается, а так раз два и готово 
evmir, можно двумя способами: 1. скачать все файлы myttssh.exe, updater.exe и rules.txt (если блокируется доступ в интернет то при проверке обновлений программе еще нужен доступ на сайт tts-alenka.narod.ru); 2. скачать только myttssh.exe а остальные загрузятся после первого запуска.
- Цитата :
- как с правилами замен из .dic словарей? их все надо в rules.txt вставлять?
это просто надстройка с дополнительной функцией обработки текста regexp-словарем для нее нужна программа балаболка с подключенным набором словарей (путь к программе *.exe указать нужно) если выбрать "только замены" тогда не нужна, будет работать только словарь rules.txt (набор правил - только левая часть правила, та которую нужно удалить) для демагога пока нет потому что там нет поддержки командной строки для преобразования текста, или есть? 
очень очень давно нужна была и наверно еще пригодится кому-то 
balabolka, да  |
|
|
 | |
muk79 Участник «online словари»
Сообщений : 103
Репутация : 29
 | |
 | |
evmir_troll-hunter Admin
Сообщений : 628
Репутация : 208
 | 31.12.12 2:10 |  |
| - Цитата :
- как с правилами замен из .dic словарей? их все надо в rules.txt вставлять?
- evilone_ пишет:
- это просто надстройка с дополнительной функцией обработки текста regexp-словарем для нее нужна программа балаболка с подключенным набором словарей
Я как раз про словари замен и хотел уточнить - теперь ясно. Хорошая идея, пакетно и быстро, спасибо!
|
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | |
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 20.01.13 13:09 |  |
| обновление: - добавился ansi-utf конвертер; - программа работает с файлами в кодировке ansi для поддержки старой версии балаболки, если файл в utf он будет автоматически преобразован; - добавился regexp-фильтр (быстрый поиск строк по шаблону);
p.s. у программы был изменен упаковщик, поэтому возможны ложные срабатывания некоторых антивирусных программ но вирусов там нет  |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 01.06.13 21:08 |  |
| изменились ссылки для обновлений - заменить файл myttssh.ini чуть позже добавим инструкцию как быстренько подготовить ass-субтитры для чтения с помощью myTTS Subtitles Helper  |
|
|
 | |
evilone_ Участник «online словари»
Сообщений : 860
Репутация : 317
 | 07.06.13 20:04 |  |
| Итак...
Как правило, наиболее часто встречающийся формат субтитров сейчас либо srt либо ass. Да, есть и много других, внешних и встроенных но в большинстве случаев натыкаешься именно на них.
В отличии от srt, ass субтитры, если они правильно размеченные, интереснее - в них быстро можно найти и отсеять все лишнее - то, что озвучивать не нужно, например рекламу, текст песен и прочую лишнюю для прослушивания во время просмотра информацию.
Все это можно быстро сделать при помощи программы myTTS Subtitles Helper. Быстро найти какие-то шаблонные фразы и словосочетания, например имена героев, названия, слова с цифрами и т.п. что поможет правильно подготовить и разметить текст для дальнейшего озвучивания.
После первого запуска программа обновит словари и фильтр для поиска фраз которые в дальнейшем можно будет редактировать и сохранять самому. И словарь и фильтр используют регулярные выражения для быстрого поиска и замены текста по маске.
Главное окно программы выглядит примерно так:

- В окне №1 указывается путь к папке с файлами субтитров.
- В окне №2 указывается путь к программе балаболка с помощью которой будет размечен текст.
- Окно №3 служит для ввода и редактирования правил для словаря замен. Правила строятся по принципу (что заменить)=(чем заменить) т.е. символ «=» отделяет левую часть правила от правой.
- Окно №4 – фильтр поиска по принципу совпадения т.е. если в строке будет выражение из этого списка то оно останется, отсеяв остальной текст.
- Окна №5 и №6 служат для предварительного просмотра работы правил. Скопировав текст в окно №5 результат можно будет увидеть в окне №6. Все это необходимо для удобной отладки правил, чтобы избежать ошибок замен.
- «Задержка» – в этом поле вводится число, в секундах, по истечении которого программа балаболка будет автоматически перезапущена на преобразование следующего по списку файла. Это необходимо в том случае когда она по какой-то причине «задумается». На старых версия бывало что программа зависала при обработке текста большим количеством словарей. Пустое значение автоматически отключает эту функцию.
- Опция «только замены» будет полезна если нужно обработать файлы только словарем замен без программы балаболка и ее словарей, для предварительной подготовки текста.
- В окне №7 выбирается формат субтитров для обработки. В одной папке могут быть любые файлы но программа будет обрабатывать только те из них, которые имеют выбранное расширение. Это бывает иногда удобно при преобразовании формата субтитров.
- Кнопка «обновление» проверяет обновление программы и словарей.
- Кнопка «сохранить словари» сохраняет текущий текст в окнах №3 и №4.
- Кнопка «преобразовать в srt» служит для конвертирования в формат srt субтитров из других форматов.
- Кнопка «ass теги» служит для быстрого поиска всех тегов в субтитрах. Результат выводиться в окно №6.
- Кнопки «ansi2utf» и «utf2ansi» служат для преобразования соответствующего формата субтитров для старой версии программы балаболка.
- Кнопка «фильтр» осуществляет поиск строк заданных в окне №4. Результат выводиться в окно №6.
- Кнопка «старт» запускает процесс преобразования субтитров в указанной папке.
При преобразовании файла субтитров программой балаболка, с ее словарями замен, лучше всего подходит именно формат srt как исходный. Это связано с некоторыми особенностями самих словарей замен которые могут искажать внутреннюю разметку. В результате текст может произноситься неправильно - будут звучать лишние буквы, непонятные наборы чисел и т.п. Поэтому если у вас есть субтитры в формате ass то лучше всего их предварительно обработать и преобразовать в формат srt с дальнейшей разметкой словарями с помощью программы балаболка. Для этого:- В окне №1 указываем путь к папке с файлами субтитров, и нажимаем кнопку «ass теги». Получаем список всех тегов. Как правило основной текст это Default все остальное зависит от разметки того кто создавал сами субтитры – это могут быть любые названия и т.п. песни сноски пояснения которые можно добавить в фильтр для пропуска в раздел «удаление всего кроме диалогов».
- Выбираем «только замены» и нажимаем кнопку «старт».
- После этого нажимаем кнопку «преобразовать в srt».
- Затем, предварительно отключив опцию «только замены» выбираем в окне №7 формат srt и снова нажимаем кнопку «старт».
Идем пить чай, если субтитров много, у вас есть минут 5-10 или больше в зависимости от скорости компьютера 
Следует также отметить что при преобразовании файлов программой балаболка будут использованы только те словари, которые были подключены в ней при последнем запуске. Поэтому перед преобразованием есть смысл открыть программу и включить нужные нам словари. |
|
|
 | |
|
myTTS Subtitles Helper |
---|