dedoc
dedoc copied to clipboard
Вопрос - предложение
Здравствуйте! Есть ли возможность добавить при чтении docx файлов html парсинг таблиц (как сделано например в mammoth). Иногда с pandas dataframe бывает потеря информации, когда ячейки склеены.
Также просьба добавить чтение latex формул.
Спасибо!
Здравствуйте! Не совсем понимаю, чего именно хочется от docx - можете написать подробнее, пожалуйста? На данный момент в docx ридере поддерживается чтение таблиц со склеенными ячейками (эта информация записывается в colspan/rowspan ячеек таблиц).
Аналогичный вопрос по поводу чтения latex формул - что именно имеется ввиду? Какой ожидается вход/выход, есть ли конкретные примеры использования подобной функциональности?