Baichuan-7B icon indicating copy to clipboard operation
Baichuan-7B copied to clipboard

[Question] 一个简单的概念性问题

Open TaiChiTiger opened this issue 1 year ago • 3 comments

Required prerequisites

Questions

请问这个模型和T5相比有哪些区别?是否也统一到了文本对文本的问题? 最后,您现在有要推出Instructed版本的时间线吗?

Checklist

  • [X] I have provided all relevant and necessary information above.
  • [X] I have chosen a suitable title for this issue.

TaiChiTiger avatar Jun 19 '23 02:06 TaiChiTiger

readme写基于transformer架构,我以为是编码器-解码器架构,后面说与LLaMA相似,那最后还是解码器架构,这块是我看错了,抱歉

TaiChiTiger avatar Jun 19 '23 02:06 TaiChiTiger

所以请问有sft版本的时间线吗

GDUTT1 avatar Jun 19 '23 03:06 GDUTT1

readme写基于transformer架构,我以为是编码器-解码器架构,后面说与LLaMA相似,那最后还是解码器架构,这块是我看错了,抱歉

他们的readme写的有点模糊,明明跟Llama的结构差不多,为什么不直接用Llama 从scrach训练一版中文,真是搞不懂,后面llama直接用多语种训练一版,商业化之后,谁还用这些呢

moseshu avatar Jun 25 '23 07:06 moseshu