GPT2-chitchat icon indicating copy to clipboard operation
GPT2-chitchat copied to clipboard

train.py中有bug

Open shawroad opened this issue 3 years ago • 6 comments

你好,你的evluate()中的input_ids.to(device) 那里得改一下 input_ids = input_ids.to(device).

另外, 想问你一个问题。计算loss那一块,为什么是取0到n-2的prediction_scores, label却取得是1到n-1?? 那岂不是错位了。。我的理解是这里取1到n-1的prediction_scores和1到n-1的label?? 希望给个答复 谢谢啦。

shawroad avatar Jul 08 '20 02:07 shawroad

你好,我训练出错了RuntimeError: Expected object of device type cuda but got device type cpu for argument #3 'index' in call to _th_index_select 请问具体怎么改

fangxiang00 avatar Aug 06 '20 06:08 fangxiang00

你没有gpu 所以报错了。。

shawroad avatar Aug 06 '20 06:08 shawroad

有。。。v100。。

fangxiang00 avatar Aug 06 '20 06:08 fangxiang00

问题解决了,感谢

fangxiang00 avatar Aug 06 '20 07:08 fangxiang00

你好,你的evluate()中的input_ids.to(device) 那里得改一下 input_ids = input_ids.to(device).

另外, 想问你一个问题。计算loss那一块,为什么是取0到n-2的prediction_scores, label却取得是1到n-1?? 那岂不是错位了。。我的理解是这里取1到n-1的prediction_scores和1到n-1的label?? 希望给个答复 谢谢啦。

同样的,我也觉得这里很奇怪。不知道您是怎么理解的?

BIRlz avatar Aug 19 '20 07:08 BIRlz

我基于mmi_model继续训练 LOSS值一直在2.2左右。。不降了。。你们遇到过吗???

bournes avatar Sep 11 '20 01:09 bournes