MinerU icon indicating copy to clipboard operation
MinerU copied to clipboard

是否有办法只读取pdf中的文本内容,其他格式的内容只进行定位,比如公式和图片

Open dhr1997 opened this issue 2 months ago • 1 comments

因为有的时候除了文本内容以外,其他格式的内容都有解析失败的风险,尽管目前已经非常小了。所以我想要只提取pdf中的文本内容,同时其他格式的内容根据定位从pdf中截取出来

dhr1997 avatar Dec 14 '24 08:12 dhr1997