FlagEmbedding
FlagEmbedding copied to clipboard
推理时,使用gpu运行时cpu内存为什么也会占掉好几个G
使用gpu运行时, 权重不是都在GPU上吗,为什么cpu内存也会占掉好几个G?
推理完的embedding会放到cpu上
在没有推理时,也就是启动后到准备就绪,cpu内存就会有几个G一直被占用着。权重不是都在GPU上,是被什么占用了,pytorch框架?