XuanZe Liu
Results
2
comments of
XuanZe Liu
> > > 感觉可以看看unstructured这个库,我在自己的fork上给pdf解析引入了它 > > > > > > 效果有增强不,之前我们使用dify的项目,他们也用到unstructured这个了,但是感觉pdf解析的很一般,不如fastgpt的 > > 我主要是用来解析图片和表格,效果还行,但是缺点就是太慢了。它虽然有fast模式很快,但是不能解析图片表格这些。 总的来说适合异步离线任务,实时分析的话需要的部署设备性能很高。 最近我找到一个很好的文档解析库,100页PDF
@DicksonWallace You can try to search for the Textin plugin on the [dify marketplace](https://cloud.dify.ai/plugins?category=discover); using this plugin can solve the problem you mentioned. https://github.com/langgenius/dify/issues/21375#issuecomment-3034938981