Zhe Chen

Results 316 comments of Zhe Chen

Hi, I recently fixed this issue and should be able to use the new transformers version now.

Hello, this seems to be the wrong shape of the image tensor you entered, please check it

你好,可以在每次运行之后都执行torch.cuda.empty_cache()清空缓存

Quick Start中的例子有的已经达到10k以上token了,所以占用的显存会比较多。

请问您安装的deepspeed的版本是0.10.0还是0.13.5呢,这个应该是deepspeed本身的问题,您可以去他们仓库的issue里检索一下看看能不能找到解决方案

您好,能否提供一下您的测试图片以及发送给模型的提问

能否提供一下您的环境信息,比如transformers, accelerate的版本之类的

这个问题已经修复

您好,这个需要您根据您的数据做一些尝试哦