ykallan
ykallan
i just uninstall pywin32=227 , and, install pywin32=300, and got the same error
> Built-in extension does not work atm with different errors. The original one by kohya-ss works, but it is much less convenient to use. want to know how can i...
同样遇到了这个问题
问题应该已解决,目前我的解决方案是,首先用AutoModel,把模型名称填入进去,然后等待模型下载好后,把模型从~/.cache/xxx 路径下,复制到项目目录,然后修改脚本,这样是可以启动的,直接通过云盘下载的模型,缺少一些文件,不能直接启动 @yaleimeng @feixyz10 @helloxz @Ling-YangHui
同样遇到这个问题,看起来应该是adaseq加载数据集的时候,可能处理逻辑有问题,加载数据集的格式 ···text data_type: json_spans ··· 可能有点问题
初步怀疑是windows电脑 c盘没有容量了,等我回去换个电脑试一试
> 初步怀疑是windows电脑 c盘没有容量了,等我回去换个电脑试一试 清理了C盘容量后还是报相同的错误
> 不建议在windows环境下使用本教程 感谢回复,已经在另外一台电脑上,使用相同代码跑起来了,同样是win系统
后面把微调的参数调整一下: ```python args = TrainingArguments( output_dir="./output/llama3", per_device_train_batch_size=4, gradient_accumulation_steps=4, logging_steps=10, num_train_epochs=16, save_steps=300, learning_rate=1e-4, save_on_each_node=True, gradient_checkpointing=True, fp16=True, # 放开这里 ) trainer = Trainer( model=model, args=args, train_dataset=tokenized_id, data_collator=DataCollatorForSeq2Seq(tokenizer=tokenizer, padding=True), ) trainer.train() ``` 在训练的时候会报错:...
显卡使用的是3090,cuda和cudnn更新到最新版12.1 nvcc -V: ```text nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2023 NVIDIA Corporation Built on Mon_Apr__3_17:36:15_Pacific_Daylight_Time_2023 Cuda compilation tools, release 12.1, V12.1.105 Build cuda_12.1.r12.1/compiler.32688072_0 ``` nvidia-smi: ```text Sun...