MNN
MNN copied to clipboard
Will MNN Chat app support ”Speculative Decoding“?
请问是否有计划下一步加入Speculative Decoding?MNN框架下的LLM拥有高度的一致性,相对大内存与较低的算力更适合双模型同时加载。
正在实现中,预计本月会支持
Marking as stale. No activity in 60 days.