ChatGLM-Finetuning
ChatGLM-Finetuning copied to clipboard
关于GLM1 Tokenizer的疑问
SPTokenizer的encode函数和tokenize函数都接受一个add_dummy_prefix参数,该参数的作用是控制是否添加一个虚拟的空白。代码中在add_dummy_prefix为True时什么都不做,而在代码为False时,在前面插入了