Honor_of_Kings_Multi-modal_Dataset
Honor_of_Kings_Multi-modal_Dataset copied to clipboard
Feature:数据集整理
在阅读项目代码时,数据比较纷杂,包含语音、文本、图片等多模态数据,这边提出我的一些建议:
- 这些可以单独放一个repo中,或者新建一个文件夹存放,与爬取或处理这些数据的脚本放一起。因为这些数据可能时常需要更新维护,或者修改处理方式,这样可能更方便迭代。
- 完善readme,标注数据来源、数据格式、数据如何使用等