ChatGLM3 icon indicating copy to clipboard operation
ChatGLM3 copied to clipboard

TypeError: GenerationMixin._extract_past_from_model_output() got an unexpected keyword argument 'standardize_cache_format'

Open zhoujiaxinii opened this issue 1 year ago • 2 comments

System Info / 系統信息

python3.11 CUDA 12.1

Who can help? / 谁可以帮助到您?

No response

Information / 问题信息

  • [X] The official example scripts / 官方的示例脚本
  • [ ] My own modified scripts / 我自己修改的脚本和任务

Reproduction / 复现过程

执行官方给的jupyter脚本

Expected behavior / 期待表现

在使用autodl平台上的服务器微调训练,在17次时出现这个问题

zhoujiaxinii avatar Sep 15 '24 12:09 zhoujiaxinii

相同的问题 请问解决了吗

Hoyxxx avatar Sep 20 '24 14:09 Hoyxxx

先用transformers 4.40 老模型维护少,GLM-4会跟进维护到4.45

zRzRzRzRzRzRzR avatar Oct 01 '24 11:10 zRzRzRzRzRzRzR

报错: TypeError: GenerationMixin._extract_past_from_model_output() got an unexpected keyword argument 'standardize_cache_format'

kongfanyu avatar Dec 16 '24 10:12 kongfanyu

这个bug修了,在huggingface中文件更新了

zRzRzRzRzRzRzR avatar Jan 06 '25 06:01 zRzRzRzRzRzRzR