Orion icon indicating copy to clipboard operation
Orion copied to clipboard

技术报告里面的几个点,希望能够解答一下

Open 202030481266 opened this issue 1 year ago • 5 comments

感谢星空官方开源诸多有用的模型,技术报告也很详细,但是我还是想问几个关于报告中的细节的问题,希望有人能够解答。

  1. 技术报告里面谈及了使用专有的数据质量模型来对内容进行质量判断,那么这里有一个问题就是这个数据质量模型是怎么训练得到的呢?或者说质量高的数据集的标准是什么呢?
  2. 综合了评测数据集的分数来看,Orion-14B应该和Qwen-14B性能不相上下,但是我想知道技术报告中的Qwen-14B-Chat有没有经过RLHF的对齐?如果是的话,那么Orion-14B的SFT的效果无疑是非常好的。
  3. Orion-14B的最大创新尝试在于数据调度训练策略这一块,但是整体来看,似乎数据调度训练的策略对于模型的性能影响并不是非常大,是不是受限于14B的大小,还无法充分体现这个策略的正确性?
  4. 对于Orion-14B-RAG模型和Orion-14B-Long模型的微调技术大家应该都会十分感兴趣,官方有意向开源这方面的内容吗?

202030481266 avatar Jan 22 '24 07:01 202030481266

+1

daixiangzi avatar Jan 22 '24 08:01 daixiangzi

我非常好奇Orion-14B-RAG模型这个版本,有木有什么其他的特性以及使用方法什么的?

Labmem009 avatar Jan 23 '24 03:01 Labmem009

Qwen-14B-Chat应该是对齐过的,阿里的技术报告中有提到

Unintented avatar Feb 19 '24 09:02 Unintented

Qwen-14B-Chat应该是对齐过的,阿里的技术报告中有提到

我的疑问在于他们对标的模型,因为他们可能只用了SFT的QWEN,不过过了这么久也没有解答,还真的有点失望。

202030481266 avatar Feb 19 '24 13:02 202030481266

我非常好奇Orion-14B-RAG模型这个版本,有木有什么其他的特性以及使用方法什么的?

+1

cat-sun avatar Mar 25 '24 08:03 cat-sun