Yang An

Results 55 comments of Yang An

您好,不太清楚PAI团队的CLIP具体是哪一个哈,目前据我们所知,在我们列举的几个中文检索benchmark上,我们是开源双塔图文表征模型中最好的哈。

您好,直接的脚本可能还不太方便提供,因为我们内部和外部版本的代码还有些不同。关于预训练的超参,您可以直接参见我们的技术报告哈,应该给的还是比较全的,如果有遗漏的方面,您直接在这里追问就好哈。

您好,您可以看下是否可以考虑并行、多进程等方式处理哈。移到GPU上面进行图像处理,我们还没有尝试过,也希望您如果有这方面的成功尝试能帮我们提个PR哈。

您好,建议最好还是采用int哈,我们确实没有尝试过准备为string类型进行后续流程的测试。

您好,请参见readme哈,我们有整个流程的介绍。 @1605707467qq

您好,请问您能方便提供一下具体执行的代码和输出吗?我们检查一下。方便的话,也可以提供下机器的运行环境

请问如果在cpu下(device直接置为cpu),也有这个情况吗?

@michaelzfm 请问有没有观察过两个平台除了最终结果,中间输出的log是否有区别呢?另外是否有尝试过清除过缓存的模型,重新下载,以防是下载时候模型文件损坏呢?

@michaelzfm 您好,cnclip使用的分词器和bert官方一致的(WordPieceTokenizer),您可以参见transformers或者Bert官方原版实现哈。

您好,打开flash attention后模型是否可以转tensorRT部署我们还需要看下哈,之前确实没有测试过,有结论的话我们会尽快回复哈,也希望您也能帮我们验证下是否通。