zhj96

Results 2 issues of zhj96

发现prompt利用Ziya-LLaMA-13B-v1的tokenizer 进行编码后,再解码,和原始prompt有区别。 官方提供提供的prompt模板如下: ` prompt = ':' + inputs.strip() + '\n:'` 当我输入prompt为: ` :管理中的方案制作和投标\n:` 先用tokenizer编码,再直接解码,输出结果为: ` :管理中的方案制作和投标\n :` 可以看到和各多出了一个空格,有时候还会多出两个空格. 我的全部代码如下: ``` from transformers import AutoTokenizer from transformers import LlamaForCausalLM tokenizer...

I tried multiple sets of experiments, but found that ZB is better than 1F1B. Interleaved 1F1B seems to be slightly faster than ZB_V, slightly slower than ZB_2P but saves a...