tianchi-multi-task-nlp icon indicating copy to clipboard operation
tianchi-multi-task-nlp copied to clipboard

所有的预测结果均为一类

Open miziha-zp opened this issue 4 years ago • 1 comments

训练结果可以达到readme的说法,但是inference出来都是一类,不知道是啥情况,所以想请教一下/滑稽

miziha-zp avatar Dec 08 '20 08:12 miziha-zp

刚刚修复了,我得错,抱歉。 具体是因为 flower = tokenizer([data_dict[idx]['s1'] for idx in cur_ids_list], add_special_tokens=True, padding=True, return_tensors='pt') 在inference的时候tokenize设置了一个max_len,然后传参数的时候传成一个True,导致整个句子tokenize完之后全部都是padding,没有任何文本的embedding。 非常抱歉!

rogerrojur avatar Dec 08 '20 10:12 rogerrojur