balabolka V.I.P.
Сообщений : 1212
 | 14.09.17 21:31 |  |
| Версия 1.44 Добавлено извлечение текста из файлов форматов XLS, XLSX, ODS. Текст извлекается в виде CSV; это текстовый формат, предназначенный для представления табличных данных:
- Каждая строка - это одна строка таблицы.
- Колонки отделены друг от друга запятыми.
- Поля, содержащие зарезервированные символы (двойная кавычка, запятая, точка с запятой), обрамляются двойными кавычками.
Новые параметры командной строки:
--csv-comma Использовать запятую как разделитель значений колонок при извлечении данных из файлов форматов XLS/XLSX/ODS (используется по умолчанию).
--csv-semicolon Использовать точку с запятой как разделитель значений колонок.
--csv-space Использовать пробел как разделитель значений колонок.
--csv-tab Использовать табуляцию как разделитель значений колонок.
--csv-double-quote Использовать двойные кавычки как ограничитель строк при извлечении данных из файлов форматов XLS/XLSX/ODS (используются по умолчанию).
--csv-single-quote Использовать одиночные кавычки как ограничитель строк. |
|
|
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 24.09.17 19:31 |  |
| Версия 1.45 Добавлено извлечение текста из файлов формата EML (сообщения электронной почты). |
|
|
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 30.09.17 17:36 |  |
| Версия 1.46 Добавлено извлечение текста из файлов формата WRI (Microsoft Write).
Исправлено извлечение текста из файлов формата EML. |
|
|
balabolka V.I.P.
Сообщений : 1212
Репутация : 986
 | 28.10.17 18:56 |  |
| Версия 1.47 Обновлено извлечение текста из файлов форматов EPUB и MHT.
Исправлено извлечение текста из файлов формата DOCX. |
|
|