LLaDA icon indicating copy to clipboard operation
LLaDA copied to clipboard

LLADA支持batch推理吗

Open duterscmy opened this issue 4 months ago • 5 comments

为什么推理脚本默认每次只推理一个样本,请问是算法逻辑不支持batch推理吗?

duterscmy avatar Aug 12 '25 09:08 duterscmy

看到其他diffusion LLM的工作,比如diffullama是支持batch inference的,请问有什么区别吗

duterscmy avatar Aug 12 '25 10:08 duterscmy

支持啊,只是作者没写而已

Kamichanw avatar Aug 16 '25 09:08 Kamichanw

需要自己花费一下心思改一下generate函数。

Haohao378 avatar Aug 16 '25 12:08 Haohao378

@duterscmy

你好,dllm 为LLaDA提供了微调和batch推理的脚本,可以参考一下!

ZHZisZZ avatar Sep 22 '25 04:09 ZHZisZZ

感谢关注!LLaDA原理上是支持的,需要修改一下模型文件支持attention mask输入和generate函数。我们会在近期release相关代码。

nieshenx avatar Sep 25 '25 12:09 nieshenx