ChatGLM3
ChatGLM3 copied to clipboard
TypeError: GenerationMixin._extract_past_from_model_output() got an unexpected keyword argument 'standardize_cache_format'
System Info / 系統信息
python3.11 CUDA 12.1
Who can help? / 谁可以帮助到您?
No response
Information / 问题信息
- [X] The official example scripts / 官方的示例脚本
- [ ] My own modified scripts / 我自己修改的脚本和任务
Reproduction / 复现过程
执行官方给的jupyter脚本
Expected behavior / 期待表现
在使用autodl平台上的服务器微调训练,在17次时出现这个问题
相同的问题 请问解决了吗
先用transformers 4.40 老模型维护少,GLM-4会跟进维护到4.45
报错: TypeError: GenerationMixin._extract_past_from_model_output() got an unexpected keyword argument 'standardize_cache_format'
这个bug修了,在huggingface中文件更新了