FlagAI
FlagAI copied to clipboard
[Question]: 预训练数据使用的tokens数
Description
想问下,Aquila-7B、以及要发布的Aquila-30B,在预训练中,一共使用了多少tokens的语料呢?
Alternatives
No response
Aquila系列模型的训练数据规模及分布情况将在官方技术报告中呈现(预计6月底发布,敬请期待)