FunASR

FunASR copied to clipboard

Published 3 months ago •

Reame
Issues

端侧化，paraformer转RK框架，跪求fp16模型或者finetune训练方案

Open Xsx93 opened this issue 1 year ago • 6 comments

背景：我在探索paraformer在端侧上部署方法，我希望通过RK框架调用NPU进行推理。RK框架只支持fp16精度的模型进行推理。 FP16的表示范围[-65504 ~ 66504]，FP32表示范围[-3.4×10^{38},3.4×10^{38}],因此FP32模型直接转RK模型，在推理过程中会出现溢出（NAN）。

我采用了FUNASR教程：https://github.com/alibaba-damo-academy/FunASR/blob/v0.8.8/funasr/export/README.md ，进行INT8量化，然而该方案是动态量化，在真正计算时仍会逆量化为fp32。问题：

请问是否有真正的fp16模型或者finetune训练方案？

Feb 08 '24 06:02 Xsx93

Maybe you could ref to this code: https://github.com/alibaba-damo-academy/FunASR/commit/33f2d469a6574a57e18fe77aef2c98549273169a

Feb 28 '24 12:02 LauraGPT

Maybe you could ref to this code: 33f2d46

请问一下，怎么具体使用这两句代码？scale的大小是多少？

Mar 05 '24 07:03 Xsx93

Maybe you could ref to this code: 33f2d46

请问一下，怎么具体使用这两句代码？scale的大小是多少？

请问，你做到端侧的方案是什么？

Mar 21 '24 05:03 Text2-m

Maybe you could ref to this code: 33f2d46

请问一下，怎么具体使用这两句代码？scale的大小是多少？

请问，你做到端侧的方案是什么？

2pass方案

Mar 25 '24 01:03 Xsx93