Страница 1 из 1

[FAQ] Почему нет оценки времени чтения текста?

Добавлено: 27 ноя 2019 05:26
balabolka
Хотелось бы, чтобы "Балаболка" показывала предполагаемое время, которое потребуется для чтения текущего текста. Почему в программе нет такой статистики?

Сейчас не планирую добавить такую возможность в "Балаболку". Существует слишком много факторов, от которых зависит продолжительность чтения текста:
  • на каком языке написан текст (также, текст может содержать вставки на других языках);
  • какой голос будет читать текст;
  • какая задана скорость в настройках голоса;
  • как много в тексте тегов SAPI (теги не читаются, так что их длину надо вычесть из объема текста; но теги могут ускорить или замедлить чтение, добавить паузы и т.д.);
  • какие в настройках программы заданы паузы после предложений и абзацев;
  • как много в тексте чисел (например, четыре цифры "1972" = тридцать одна буква);
  • сколько в тексте сокращений, аббревиатур и т.д. (и как голос умеет их расшифровывать);
  • какие к тексту будут применены правила коррекции произношения;
  • другие факторы.
Получается, что "честно" вычислить продолжительность чтения текста на основе только лишь самого текста очень сложно. А использовать какой-либо простой способ подсчета (например, 1 минута = 130 слов) не хочу.

[FAQ] Почему нет оценки времени чтения текста?

Добавлено: 27 ноя 2019 11:35
Lecron
Честно вычислить нельзя, а вот с достаточно высокой точностью — можно.
* Берем фрагмент текста. Запускаем фоновую озвучку в отдельном потоке. Без вывода на колонки она отработает крайне быстро. Получаем время. Пересчитываем на весь текст. Размер фрагмента подбираем опытным путем. Предположу что 2Кб (~1 страница книжного текста) хватит для точности прогноза ±1%. По крайне мере, первые три пункта списка, чье влияние на время ключевое, будут учтены.
* Результат и вводные (голос, скорость) сохраняем и если в следующем задании они не изменились, показываем результат сразу. Это учтет только 2 и 3 пункты списка, но точность останется по прежнему велика.
* Сохраняем результаты для множества различных вводных, подбирая из них нужные.
* Собираем результаты из уже существующего алгоритма, работающего в процессе чтения. Тогда даже не понадобится фоновый запуск.

[FAQ] Почему нет оценки времени чтения текста?

Добавлено: 27 ноя 2019 11:51
good_cat
Lecron, а зачем "брать жернов чтобы карандаш очинить"? Для русского языка существует очень простая приблизительная формула - 1000 символов приблизительно 1 минута звучания на скорости 0.
Если озвучивание из интернета, чтение новостей и т. д., то возникает вопрос: зачем нужен прогноз?

[FAQ] Почему нет оценки времени чтения текста?

Добавлено: 27 ноя 2019 16:04
Lecron
good_cat,
а) Программа имеет мировое распространение.
б) Вы так уверены, что все русские голоса болбочат одинаково?
в) Почему скорость 0? Например у меня выставлен максимум.
good_cat писал(а):
27 ноя 2019 11:51
Если озвучивание из интернета, чтение новостей и т. д., то возникает вопрос: зачем нужен прогноз?
Зачем, это другой вопрос. Мне вообще не надо, просто высказал идеи. Собирать статистику использования и на ее основе, при возможности, делать адекватный прогноз... почему бы и нет.

[FAQ] Почему нет оценки времени чтения текста?

Добавлено: 27 ноя 2019 17:55
good_cat
А для чего прогноз? Вот в чем вопрос. Почему бы и нет? Это уже из области философии. В мире очень много интересного. А приблизительную априорную оценку я указал. При необходимости ее можно уточнить.

[FAQ] Почему нет оценки времени чтения текста?

Добавлено: 28 ноя 2019 01:02
tonio_k
Были у меня наручные электронные часы. Так вот, в настройках можно было выставлять плюс или минус с шагом в 0.1. Путем экспериментов выставил у себя +1.3 В результате часы спешили всего на 1 секунду в месяц. Может что то подобное добавить в настройки? Установить базовый
приблизительная формула - 1000 символов приблизительно 1 минута звучания на скорости 0.
и каждый в настройках меняет цифру - количество символов, тем самым под себя ускоряет или замедляет скорость для оценки продолжительности чтения текста