PowerPaint icon indicating copy to clipboard operation
PowerPaint copied to clipboard

训练数据集构建问题

Open zhLawliet opened this issue 5 months ago • 1 comments

@zengyh1900 我下载的laion数据集,每一张图会对应一个json image 问题1:你的laion数据集中,随机mask对应的提示词是上面json里面的caption吗? 问题2:如果是,我理解anno_info["remark"]是对应上面json,为什么prompt来自anno_info["content"],而不是来自remark 问题3:如果不是,anno_info["content"]是怎么来的,我理解随机mask对应的提示词是不是也得通过blip来获取? 问题4:可以提供几个样本和对应的annotation文件吗或者有一个文档能解释一下每一个文件的意义和构建来源,以及每一个字段的意义?方便我们清晰地知道你的数据结构是什么样的。 image

zhLawliet avatar Sep 25 '24 09:09 zhLawliet