pdf2docx icon indicating copy to clipboard operation
pdf2docx copied to clipboard

矢量图被错误解析成表格

Open mjTree opened this issue 3 years ago • 5 comments

image 问题如图所示。

文件链接: 246KB,链接:https://pan.baidu.com/s/1zYVu1UrAc2CyVpd6eT_LDg 提取码:i481

mjTree avatar Oct 28 '21 09:10 mjTree

出现一个表格

mjTree avatar Oct 28 '21 09:10 mjTree

int' object has no attribute 'value 转换PDF报这个错误 page.parse(**kwargs) 这个方法

a1046097466 avatar Nov 02 '21 10:11 a1046097466

int' object has no attribute 'value 转换PDF报这个错误 page.parse(**kwargs) 这个方法

参考 #120 #111

dothinking avatar Feb 12 '22 17:02 dothinking

@mjTree 从结果来看可能是把上面柱状图的一些边框线当作表格来解析了,目前对矢量图的处理确实还存在一些问题。

抱歉之前没有及时下载你提供的测试文件,现在网盘分享已经过期了,方便的话麻烦重新分享一下。谢谢。

dothinking avatar Feb 15 '22 17:02 dothinking

@dothinking 是否可以添加个参数,控制是否输出矢量图?

zhongguogu avatar May 09 '22 08:05 zhongguogu