kolagood

Results 1 issues of kolagood

### Describe the bug A clear and concise description of what the bug is. 用dify配置xin进行推理,其中已经有一个任务正在持续单点调用qwen2模型。如果再进来一个请求(也就是两个请求一起处理时候)第二个请求看xin容器里日志就报错”probability tensor contains either `inf`, `nan` or element < 0“ [xinference多个请求推理报错.txt](https://github.com/user-attachments/files/15985198/xinference.txt) 但是有时候两个模型同时提问也不报错,大概率会报错: ![image](https://github.com/xorbitsai/inference/assets/173891622/1b138252-9109-4075-b057-08c93e0e1226) ### To Reproduce...

gpu
stale