ztayty
Results
2
comments of
ztayty
> 如题,有些时候数学公式识别出来不一定正确,如果能提供MD预览,就可以快速在识别结果上修改 OpenDataLab 开源的这个MinerU项目可以很好地把PDF里的公式提取出来,专门为大模型语料从复杂文档(PDF、网页、电子书)中提取开发的工具,效果挺好,速度也很快,需要的话,可以看看:https://github.com/opendatalab/MinerU
> ### Issues > * [x] I have browsed through the Issues. 我已浏览过Issues,确定没有重复的建议。 > > ### Expected behavior 预期的功能 > 通过增强解析功能,使系统能够识别并将PDF文件中的表格转换为可读的Markdown格式,从而提高文件的可读性和可编辑性。 > > ### Approximate reference (optional) 近似的参考(可选) > _No...