Bob Tsang
Bob Tsang
我在文本层次多标签分类任务上复现了文章中的meta-weight-net,但是感觉效果并没有提升,对比我的baseline只上升了0.2%,我想画出权重跟loss的分布图分析下原因。
汉字拆字字典
请问大佬是如何得到新华字典的部首呢?有什么方法可以获得授权么?如果可以的话可以单独发一份给我嘛~
### Reminder - [X] I have read the README and searched the existing issues. ### System Info ### model model_name_or_path: /mnt/nas/shanzhi/eval_models/Qwen2-72B ### method stage: sft do_train: true finetuning_type: full ###...
Pull Request: 多语言 MMMLU BenchMark评测实现 Motivation 在多语言环境下,已有的 MMLU 实现存在局限性。因此,我们希望通过本 PR 引入OpenAI的多语言评测集支持,观测模型在不同语言任务下的表现。目标是实现一个可以评测多种语言(如中文、法语、西班牙语等)的方法。 Modification 本 PR 修改了以下内容: 在数据集支持中增加多语言支持,包括语料的下载和预处理。 实现了多语言mmlu评测pipeline,使得模型能够在多种语言上进行评估。 更新了模型评估和基准测试,增加了多语言的评估指标。 BC-breaking (Optional) 此修改未引入向后不兼容的变化,所有旧的 API 和方法仍然可用,用户可以在新的多语言功能与原有功能之间自由切换。 Use cases (Optional) 本 PR 支持多语言能力,使得开发者可以在一个统一框架下评测多种语言的任务。 Checklist...