oyyuyu
oyyuyu
增加数学公式的支持太需要了,可惜p2t识别公式精度有点低,不知道是不是跟个人电脑配置有关?有个叫simpletex的公式混合效果特别好,是否可以参考下。另外nougat的公式识别精度很高,这个应该是开源的,遗憾的是好像不支持中文。
> @oyyuyu 感谢建议。 > > p2t有闭源收费的模型,据说效果更好。 https://www.breezedeus.com/article/p2t-mfd-20230702 https://www.breezedeus.com/pix2text_cn > > [simpletex](https://simpletex.cn/) 我了解过,闭源,只支持在线。个人用它家软件是免费的,可惜API只有1000次免费调用额度。 > > [nougat](https://github.com/facebookresearch/nougat) 有点意思,不过似乎只支持PDF,不知道有没有图像的接口。以后有空看看。 nougat应该有图像接口,网络上见过把nougat做成本地截图版本的实例,另外GitHub里有个[RapidLatexOCR]公式识别好像也还行(试了下demo网站),不知是不是可以做个参考?
> @oyyuyu 实际上,RapidLatexOCR与P2T的模型都来自 [LaTeX-OCR](https://github.com/lukas-blecher/LaTeX-OCR) 这个项目,所以它们的识别精度理应是没有差距的。Rapid在性能上优化更好。 > > 总之就公式识别部分而言,P2T与Rapid的差距并不大;而P2T额外具有文字+公式混合图片的识别能力。所以暂时Rapid没有更多优势,让我有动力去适配。 我也安装了一下RapidLatexOCR,实测本地效果离demo网站的效果有不小差距。谢谢你的解释,愿你的软件越来越好。
> @oyyuyu @breezedeus 可关注下[Vary](https://github.com/Ucas-HaoranWei/Vary),[效果展示和原理介绍](https://mp.weixin.qq.com/s/Sg_yHAVVN-yAYT61SNKvCA),功能参考nougat,支持中英文 有demo。我是作者之一,欢迎反馈 测试了一下demo,很强啊,感谢大佬。