DeepSeek-LLM
DeepSeek-LLM copied to clipboard
关于模型指标有一些疑问
为什么Deepseek-Math-7B-rl 已经到了88.2%,但是DeepSeek-LLM-67B Chat只有84%?67B的综合模型,在数学能力上比7B的Math专有模型要差。