UER-py
UER-py copied to clipboard
关于预训练target为mlm的问题
你好,我看代码在构建mlm数据集的过程中,针对一条数据,并没有在开头和结尾加入[CLS]和[SEP],不知道是代码漏加了还是在训练mlm的时候不需要加入这两个token
您好,我认为不需要加入 对效果影响很小 下游任务可以把[CLS]训练好