MNBVC icon indicating copy to clipboard operation
MNBVC copied to clipboard

威力里的数据跟抱脸里的数据是否一样?

Open Gierry opened this issue 2 years ago • 5 comments

我现在威力同步后的数据打开看很多数据很乱, 看起来就是没有清洗的,且目录跟抱脸的目录也不一致, 请问数据是一样的吗, 是一样的我就不重复下载了,感谢回复

Gierry avatar Sep 19 '23 10:09 Gierry

不一样,威力包括没有完成清洗的数据,威力里的数据和百度网盘是一样的。可以参考其他issue #35

esbatmop avatar Sep 20 '23 01:09 esbatmop

还是不太明白, 35里说的是建议使用抱脸里已经清洗的数据, 那我理解威力同步的数据是原始没有清洗的+已经清洗的, 我如何在威力里区分哪些是清洗的, 哪些还没有清洗, 我正在做数据整理, 发现了很多不可用的数据, 且对已经清洗的数据检查发现也还有很多问题, 这个很困扰我, 感谢再次回复

Gierry avatar Sep 20 '23 10:09 Gierry

威力里的数据在持续清洗中(这需要很多人力的投入,需要时间,我们离国外成熟数据集还有很大距离),清洗好后会更新威力的包。最终威力里的所有数据会统一到下面几种格式:https://wiki.mnbvc.org/doku.php/%E7%8E%B0%E6%9C%89%E8%AF%AD%E6%96%99%E6%A0%BC%E5%BC%8F

esbatmop avatar Sep 22 '23 08:09 esbatmop

百度云盘也包含了未清洗的数据吗

chinoll avatar Nov 13 '23 06:11 chinoll

百度云盘也包含了未清洗的数据吗

百度云盘的数据跟威力的数据是完全相同的,即包括未清洗的数据。

xclimbing avatar Nov 14 '23 02:11 xclimbing