g9420
g9420
  使用聊天页面的v1接口可以连接成功
模型部署在1,5|2,3卡上,进行对话时提示gpu 0卡显存不足 目前只有闭源模型layout和ocr部署在0卡 查询0卡进程,发现有一个backend-stub显存占用15g  杀死该进程后,模型无法正常使用,显示如下  请问该进程是模型启动占用得显存吗,为什么没有部署在0卡,0卡却有进程占用显存
使用接口调用某个技能时,当进行批量调用时,平台界面响应时间变长  长时间运行后,处理性能下降,处理每一条的时间从几十秒变为几十分钟  再次调用平台技能接口,5分钟后超时返回 重启毕昇平台容器后,批量处理速度回复正常,但平台页面响应时间仍为10s以上