DFGN-pytorch
DFGN-pytorch copied to clipboard
数据长度的问题
现在的max_seq_length是512,但是我看原始数据,一个问题下的所有paras拼接起来都是大于512的,按512截断的话,会不会把answer位置给截下来了?我看代码里超过512的只有截断,是吧?对于长度超过512的文本,有没有什么好方法处理一下?
补充:doc_tokens是question+后面接问题下所有相关文章的文本,是吧?