Honor_of_Kings_Multi-modal_Dataset icon indicating copy to clipboard operation
Honor_of_Kings_Multi-modal_Dataset copied to clipboard

Feature:数据集整理

Open little1d opened this issue 7 months ago • 1 comments

在阅读项目代码时,数据比较纷杂,包含语音、文本、图片等多模态数据,这边提出我的一些建议:

  1. 这些可以单独放一个repo中,或者新建一个文件夹存放,与爬取或处理这些数据的脚本放一起。因为这些数据可能时常需要更新维护,或者修改处理方式,这样可能更方便迭代。
  2. 完善readme,标注数据来源、数据格式、数据如何使用等

little1d avatar Jul 22 '24 04:07 little1d