苏剑林(Jianlin Su) comments

Results 390 comments of


                                            苏剑林(Jianlin Su)

词典中不存在词的词嵌入

> 如果出现了词表中不存在的词Z, 将Z转换成id的 tokenizers.py 第199行self._token_dict.get(“Z”, self._token_unk_id) 会等于self._token_unk_id，而这个没定义。你究竟能不能理解一下我前面说的话？只要你的词表有[UNK]，那么这个`self._token_unk_id`就不会报错，也就是有定义，这个定义不是通过`self._token_unk_id = xxx`来定义，是通过`setattr`来定义。我真不知道你在纠结什么...

词典中不存在词的词嵌入

> > > 如果出现了词表中不存在的词Z, 将Z转换成id的 tokenizers.py 第199行self._token_dict.get(“Z”, self._token_unk_id) 会等于self._token_unk_id，而这个没定义。 > > > > > > 你究竟能不能理解一下我前面说的话？ > > 只要你的词表有[UNK]，那么这个`self._token_unk_id`就不会报错，也就是有定义，这个定义不是通过`self._token_unk_id = xxx`来定义，是通过`setattr`来定义。 > > 我真不知道你在纠结什么... > > 感觉是我的表达问题。。我说的是对于不在词表中的新词，要从token转id的时候。跟词表里有没有[UNK]没关系。 1、对于不在词表的词，会转换为`self._token_unk_id`；...

苏剑林(Jianlin Su)

词典中不存在词的词嵌入

词典中不存在词的词嵌入

自己使用wobertplus继续做了预训练，在使用自己得到的权重微调时候，报错。想问下，大佬应该如何调整

分类问题loss为nan

分类问题loss为nan

分类问题loss为nan

分享预训练模型

GPU训练问题

GPU训练问题

多线程中模型加载