FunASR
FunASR copied to clipboard
后处理数据问题
作者您好,我注意到[ModelScope]的后处理标点恢复部分能够处理中文、英文以及中英混的情况,请问作者在后处理部分模型训练时,数据集是如何构建的呢?
比如中英混,中英混数据是通过什么方法构建的,谢谢作者