MingsYang comments

Results 8 comments of


                                            MingsYang

pyarrow.lib.ArrowInvalid: Unable to merge: Field <field> has incompatible types

@cyanic-selkie could you explain how you fixed it? I met the same error in loading other datasets, is it due to the version of the library enviroment?

pyarrow.lib.ArrowInvalid: Unable to merge: Field <field> has incompatible types

@cyanic-selkie Emm, I get it. I just tried to use a new version python enviroment, and it show no errors anymore.

How to capture the caption of images

有个图文相似性的问题请教下： 1.看到论文里会用OFA large获取caption，再通过机器翻译转成中文，最后再去做图文相似性过滤，不知道这个流程我理解的是否有问题 2.生成caption是自回归的过程吗，这样效率会是瓶颈吗，毕竟自回归太慢了，出的token数越多，循环次数越多

How to capture the caption of images

> > 有个图文相似性的问题请教下： 1.看到论文里会用OFA large获取caption，再通过机器翻译转成中文，最后再去做图文相似性过滤，不知道这个流程我理解的是否有问题 2.生成caption是自回归的过程吗，这样效率会是瓶颈吗，毕竟自回归太慢了，出的token数越多，循环次数越多 > > 是自回归的。目前做image capitioning 主要的方法就是自回归模型。确实需要比较多的计算资源。那过滤这么多数据大概用了多少计算资源和时间啊，方便告知吗，另外有尝试过非自回归的过滤方法吗，比如用多模态大语言模型走teacher forcing的方式走前向输出，根据loss划阈值过滤

How to capture the caption of images

> > 请问除了百度云有其他的脚本下载方式吗，我这边 bypy 的连接非常不稳定 > > 暂时没有。 @ksOAn6g5 @aries-young 请问下用bypy下载的正常速度是多少啊，我这边开了会员下载还只有1.x M/s，这数据量不知道要下到什么时候去

报告在 CPU 机器上使用 PaddleOCR CPU包, 2小时后遇到内存泄漏问题

> 另外换一个推理backend，也可以避免这个问题，如onnxruntime、openvino v4 导出onnx模型，然后用paddleOCR加载，use_onnx=True, use_gpu=True, 没有使用gpu推理，请问可能有什么原因吗

ppocrv5 推理显存持续升高

> 请问如果重复推理同一张图，能观察到类似的现象吗？也会出现，我这边用的固定图片尺寸，显存占用一直涨

这个文本分割支持中文吗

> https://github.com/shannanyinxiang/UPOCR 这个没有用中文数据集训练，也支持中文分割大佬在中文上试过效果吗