Yalei Meng

Results 42 comments of Yalei Meng

@FeiiYin 意思是当前公开的项目不能使用音频驱动生成说话视频吗?我看关于audio driven的几个issue也一直没有答复。 如果是这样,希望在readme里面写清楚论文中实现的东西哪些是公开的,哪些是未公开的。

大部分readme页面已经有中文版本了。另外一些没有中文的,chrome浏览器地址栏有个按钮,可以将整个网页直接翻译为中文。 在这个年代,语言不应该成为获取知识的障碍。

10 months show everything. Maybe the answer is never.

@INF800 Please read ther paper and maybe you will change your mind.... If you finished the training part of PC-AVS , maybe I'd like to try this pile of code.

Thanks ! This is what I want.

@JaheimLee 修改paddlespeech安装路径的源码。具体是 site-packages/paddlespeech/server/ws/asr_api.py 我在try块外面添加了一个变量half 保存中间结果。 当 "text" in message , signal == end时,resp 字典里面 'result': half + asr_results, # 将中间结果添加进来。 当 "bytes" in message,在 if connection_handler.continuous_decoding: 条件下,添加一行 half += asr_results...

可以在全部识别完成后调用一次标点预测。这样应该会很快。中间过程的预测没什么意义

官方样例采用了3.x的语法。 3.5试用没问题,但3.7试了不行,可能是组件不能支持最新版本。

@oscarsun72 其实在算法上:先对句子做分词,再各自进行简繁词典转换,就能大大减少这类无脑替换的错误。 目前中文分词的准确率已经非常高了,97%以上没问题。。本例中的语句完全能正确分词。

抓紧时间魔改,灌数据,很快,很快啊,5、6月份大家都可以升级一波了