Steve

Results 5 comments of Steve

> 不过modeling_chatglm.py用的官方的,之前对比过实验效果,发现微调alpaca数据之后,官方的效果之后好一点 > > 修改modeling_chatglm的结果: 是指哪一个好一些?

``` TypeError: init_process_group() got multiple values for keyword argument 'backend' ERROR:torch.distributed.elastic.multiprocessing.api:failed (exitcode: 1) local_rank: 0 (pid: 359372) of binary: /opt/conda/bin/python3.8 Traceback (most recent call last): File "/opt/conda/bin/torchrun", line 8, in...

ChatGLM-6B 的 huggingface repo 更新了,需要重新下载模型下来,然后再运行(官方的一些特殊 token 的 ID 又变了)

> > ChatGLM-6B 的 huggingface repo 更新了,需要重新下载模型下来,然后再运行(官方的一些特殊 token 的 ID 又变了) > > [https://huggingface.co/THUDM/chatglm-6b这个地址?](https://huggingface.co/THUDM/chatglm-6b%E8%BF%99%E4%B8%AA%E5%9C%B0%E5%9D%80%EF%BC%9F) 是的,然后里面模型和tokenizer 好些文件都变了