MNBVC
MNBVC copied to clipboard
威力里的数据跟抱脸里的数据是否一样?
我现在威力同步后的数据打开看很多数据很乱, 看起来就是没有清洗的,且目录跟抱脸的目录也不一致, 请问数据是一样的吗, 是一样的我就不重复下载了,感谢回复
不一样,威力包括没有完成清洗的数据,威力里的数据和百度网盘是一样的。可以参考其他issue #35
还是不太明白, 35里说的是建议使用抱脸里已经清洗的数据, 那我理解威力同步的数据是原始没有清洗的+已经清洗的, 我如何在威力里区分哪些是清洗的, 哪些还没有清洗, 我正在做数据整理, 发现了很多不可用的数据, 且对已经清洗的数据检查发现也还有很多问题, 这个很困扰我, 感谢再次回复
威力里的数据在持续清洗中(这需要很多人力的投入,需要时间,我们离国外成熟数据集还有很大距离),清洗好后会更新威力的包。最终威力里的所有数据会统一到下面几种格式:https://wiki.mnbvc.org/doku.php/%E7%8E%B0%E6%9C%89%E8%AF%AD%E6%96%99%E6%A0%BC%E5%BC%8F
百度云盘也包含了未清洗的数据吗
百度云盘也包含了未清洗的数据吗
百度云盘的数据跟威力的数据是完全相同的,即包括未清洗的数据。