Chaofan Chen
Results
2
comments of
Chaofan Chen
> 您好,在研究代码进行尝试的过程中发现损失很快降到一个值后就一直维持及小幅度的波动,准确率卡在0.2不变,检查了下发现每个batch里induction出来的几个classvector几乎差不多,所以导致了没有继续学习到。请问又遇到过类似的情况么? 我用文本分类的数据集,去掉了pos和mask编码之后,实验结果也是一直在0.2左右。恳请大佬指点!
Hi. I download the [mt0-xxl-mt](https://huggingface.co/bigscience/mt0-xxl-mt), but I don't know how to use,Can you provide the guide ?