Longformer_ZH icon indicating copy to clipboard operation
Longformer_ZH copied to clipboard

文本匹配任务使用longformer能使用交互型模型吗

Open Finnyhudson opened this issue 2 years ago • 9 comments

使用交互型模型感觉会长出长度限制导致后一文本被切断

Finnyhudson avatar Nov 24 '22 05:11 Finnyhudson

确实是这样, longformer即便是long, 也只不过是把输入长度扩展到1K,4K而已

ValkyriaLenneth avatar Nov 24 '22 05:11 ValkyriaLenneth

如果是使用双塔式模型,可以直接使用两文本的[CLS]进行相似度计算吗

Finnyhudson avatar Nov 24 '22 05:11 Finnyhudson

双塔模型我没有用过, 但是[cls]作为表征整个文本的向量,是可以用来相似度计算的.

ValkyriaLenneth avatar Nov 24 '22 05:11 ValkyriaLenneth

好的 感谢

Finnyhudson avatar Nov 24 '22 05:11 Finnyhudson

再请问下您的代码环境是什么样的(torch+cuda版本和tranformer版本),之前allenai的原版transformer版本过高会导致forward报错,需要降到3.x

Finnyhudson avatar Nov 24 '22 06:11 Finnyhudson

我记得transformer是3.2 torch1.1 cuda 11, 不过只要模型没问题, 参数直接加载就行? forward报错的话,可能API有变动

ValkyriaLenneth avatar Nov 24 '22 07:11 ValkyriaLenneth

好的 再次感谢

Finnyhudson avatar Nov 24 '22 07:11 Finnyhudson

不好意思 又打扰了 如果我想只用1024的长度来跑的话 是直接把dataset的长度固定为每个样本都为1024的长度还是说在模型的config里面去修改

Finnyhudson avatar Dec 27 '22 16:12 Finnyhudson

请问这个模型的tokenizer应该用什么

18410080631 avatar May 29 '24 10:05 18410080631