g9420

Results 3 issues of g9420

![1adeaad933be1471bb5fabc9e1c910d](https://github.com/dataelement/bisheng/assets/41284829/aa3c63e2-4ad7-48a0-b0f7-2329ce637c45) ![0569e15694b2f19026a43e00b53cc13](https://github.com/dataelement/bisheng/assets/41284829/08295f04-d21f-4c2d-8b6b-a0779c54492a) 使用聊天页面的v1接口可以连接成功

模型部署在1,5|2,3卡上,进行对话时提示gpu 0卡显存不足 目前只有闭源模型layout和ocr部署在0卡 查询0卡进程,发现有一个backend-stub显存占用15g ![image](https://github.com/dataelement/bisheng/assets/41284829/bd72a537-61ec-470e-8209-a5be3136903f) 杀死该进程后,模型无法正常使用,显示如下 ![image](https://github.com/dataelement/bisheng/assets/41284829/d71fb3d3-e947-40e2-8b48-776c1dfa364c) 请问该进程是模型启动占用得显存吗,为什么没有部署在0卡,0卡却有进程占用显存

使用接口调用某个技能时,当进行批量调用时,平台界面响应时间变长 ![c5afa9049a32c6057a2f0dee9abcc29](https://github.com/dataelement/bisheng/assets/41284829/cf567944-f302-4224-bd0a-617df288465a) 长时间运行后,处理性能下降,处理每一条的时间从几十秒变为几十分钟 ![image](https://github.com/dataelement/bisheng/assets/41284829/bc355552-cbe5-423d-b186-fb7eeaf27ec4) 再次调用平台技能接口,5分钟后超时返回 重启毕昇平台容器后,批量处理速度回复正常,但平台页面响应时间仍为10s以上