xtlan

Results 6 issues of xtlan

现在跑到4.1w数据,但其实从2.9w开始,loss就一直在26上下极小范围浮动,而valid的WER 则一直在30----50之间跳动,请问一般训练多少step的时候就差不多可以了?对应的,loss一般多少才算正常,然后什么时候判断为收敛结束训练呢?

比如论文的顺序,关键词什么的

How to deploy the kws model?Is there any source code ? Such as android or iOS.

有人用NNI剪枝过[wenet](https://github.com/wenet-e2e/wenet)吗?或者类似包含各种cache的流式transformer模型?我用起来好像问题很多,各种

rt,这个和DFN哪个效果好?