Haoran Zhou

Results 61 comments of Haoran Zhou

wenet在production方面还是有比较大的优势的,尤其是端侧的部署,以及对于LM的支持, 可以快速的做domain adaptation并且deploy流式去云端或者端上 huggingface:更是一个model hub而不是一个ASR toolkit,没有成熟decoding LM的支持,用了pyctcdecode,代码异常丑陋,但是但凡知道ngram在decoding里的威力的,懂得都懂。以前看的时候没有很好的inference支持,尤其是流式,大概率要写自己的inference pipeline。deploy到端上更是头大 ESPNET: 很好的研究框架,比huggingface专业很多,speech功能也齐全很多,但是以前也是没有deployment支持,不知道现在如何 NEMO: 你可以看看riva,nemo的model都是通过这个去部署,是一个 commercial software for deployment,而且超过一定量要收费,同样有很成熟的LM 也是TLG,有boosting word支持, 能做流式inference。但是收费!