PowerPaint
PowerPaint copied to clipboard
训练数据集构建问题
@zengyh1900
我下载的laion数据集,每一张图会对应一个json
问题1:你的laion数据集中,随机mask对应的提示词是上面json里面的caption吗?
问题2:如果是,我理解anno_info["remark"]是对应上面json,为什么prompt来自anno_info["content"],而不是来自remark
问题3:如果不是,anno_info["content"]是怎么来的,我理解随机mask对应的提示词是不是也得通过blip来获取?
问题4:可以提供几个样本和对应的annotation文件吗或者有一个文档能解释一下每一个文件的意义和构建来源,以及每一个字段的意义?方便我们清晰地知道你的数据结构是什么样的。