LLMPruner
LLMPruner copied to clipboard
词表相关
非常感谢您的开源工作!请问如果要从自己的语料上构建全新的词表,具体的流程应该有哪些?
Same question.
问下这个搞定了么? 我自己构建了词表,但是new_tokenizer(text, return_tensors='pt').input_ids的时候是空的,但是decode的时候这个词语是有的? 有人知道是什么问题么
非常感谢您的开源工作!请问如果要从自己的语料上构建全新的词表,具体的流程应该有哪些?
同问