FastBERT icon indicating copy to clipboard operation
FastBERT copied to clipboard

请问一下蒸馏阶段的无监督数据指的是什么?

Open hitnq opened this issue 4 years ago • 3 comments

README中写到 蒸馏阶段使用无监督数据,可以增强模型的鲁棒性

请问一下这里的无监督数据指的是什么?有具体的例子吗?我看script_train_stage1.sh中使用的数据还是有标签的数据。

希望能帮忙解答一下,谢谢

hitnq avatar Jul 03 '20 04:07 hitnq

因为蒸馏阶段本质是 学生学习老师的输出,那么可以是任何数据输入老师模型得到学生的学习目标。为了蒸馏效率,推荐使用和任务相关的数据(如待标注数据)来保持类别的均衡性,默认的script_train_stage1.sh直接使用了训练数据。

BitVoyage avatar Jul 03 '20 06:07 BitVoyage

哈哈哈 make sense FastBert还是看做是一个半监督的分类器 学习了

caijie12138 avatar Jul 03 '20 16:07 caijie12138

请问一下,如果补充新的无标注的数据作为蒸馏阶段的数据,那么是将 --train_data 保持不变 --eval_data 更改为无标注数据即可吗?

feiyuxiaoThu avatar Jul 22 '20 02:07 feiyuxiaoThu