danger-dream

Results 10 comments of danger-dream

Yes, our suggestion is similar, but the workload of modifying the existing monitoring code part is a bit heavy, so my suggestion is to add script type monitoring

1. max_source_length、max_target_length是输入输出文本的向量长度,可以自己用tokenizer.encode计算 2. 官方建议不超过2048,可以翻下以前的issues,有说过 3. 计入 4. 会

哈哈哈.....ChatGPT生成的吧............

这个要看数据和ptuning参数才能判断的。我这v100 40G,max_source_length 1024、max_target_length 512,其他参数不变的清空下,3万多数据需要12小时

> @ray-008 一直没懂, max_steps 1000 到底是啥意思? max_steps好像是只计算1000条数据? 看代码这个字段可以不填, 不填写会自动根据数据集的条数来计算step, 貌似你这50w条数据需要的时间会更长吧? 共训练 max_steps 步,每步 per_device_train_batch_size * gradient_accumulation_steps 条数据 共训练 max_steps * (per_device_train_batch_size * gradient_accumulation_steps) 条数据

> @exaggerated-dream 就是说, 算下来可能数据集还是没有办法都训练一次? 我看好像如果不填写这个参数, 代码里面会自动计算 对于官方提供的数据集来说,并不需要所有数据都训练完就能有不错的效果。 继续训练下去付出的时间、算力等无法得到更佳的提升回报,或者说付出和回报不成正比 都是经验、实验和权衡下的选择。

> > 修改modeling_chatglm.py chat方法,我没有用流方式 ###### if not history: prompt = query else: prompt = "" for i, (old_query, response) in enumerate(history): prompt += "[Round {}]\n问:{}\n答:{}\n".format(i, old_query, response) prompt += "[Round...

> 微信或者word里面不支持划词 是的,UIAutomation不能覆盖所有应用 但相比起模拟按键clipboard来说会少很多兼容性问题,比如在终端中滑词会触发ctrl + c 这个看个人需求来调整,也可以增加一段白名单功能,如果当前焦点是指定程序的话就用clipboard,否则用UIAutomation。 我目前暂时没空继续维护,如果你有更好的解决方案也可以告诉我,谢谢