VoxCPM
VoxCPM copied to clipboard
微调数据集收集建议
官方给出了微调相关的代码,已经是一个巨大的进步。
不过数据集的维护也是生态建设的一部分,因此呼吁看到这个issue的朋友们,可以把数据集共享一下。
当然我本人后续也会整理一些自己用到的数据集
还需要微调什么?只有语言方向需要微调了,要么就是针对某人进行微调,学习语气风格 模型的表现很大程度是受BMB他们选择的架构影响的,tokenizer free的优缺点很好的体现在模型上了,就等明年春季bmb的更新了
微调还可以做的事情还有蛮多,不过我看到今天也没有人回复,而且大多数issue里问的都是环境问题,但是能够碰上一两个为社区生态做贡献的也还是不错的。
再过一段时间,看响应的人多不多,不多的话我就自己去维护了。