rtp-llm
rtp-llm copied to clipboard
RTP-LLM 模式下,llama3.1 FP16 效果不一样
使用huggingface载入 llama3.1的生成结果,和RTP-LLM 载入结果不一致 同样的prompt,无法重现在RTP-LLM
对比一下input id和first token的hidden states?