Baichuan-7B 模型词表相关疑问

模型词表相关疑问

Open zetian1025 opened this issue 1 year ago • 5 comments

您好，感谢开源！想针对本模型的词表构建和测试咨询三个问题：

Jun 15 '23 06:06 zetian1025

同问，请问压缩率是如何计算的？

Jun 15 '23 06:06 feiyu87yeah

同问，以及为什么没直接使用BBPE进行训练，将2000万文本全部转为Byte再做BPE？

Jun 16 '23 04:06 mynewstart

2000万文本要训练多长时间啊？自己复现感觉用bpe要跑好久QAQ

Jun 16 '23 10:06 luliyucoordinate

同问同问

Jul 07 '23 03:07 zemu121

同问

Aug 23 '23 03:08 JayLee15