Zip Zou

Results 24 comments of Zip Zou

第一个报错是`train.py`没有可执行权限的哈,你可以通过`python train.py -h`执行; 第二个报错,是生成样本,如果你需要生成的话,需要使用到Java环境,安装好Java,并配置好环境变量,如果是Linux系统,就在终端里执行`java -jar xxxx`,如果是Windows系统,需要在cmd里执行`java -jar xxxx`。

colab可以直接使用!前缀执行shell脚本: `!echo Hello`和在终端上运行是一致的

Yeah, I have the same problem using v0.14 but works using v0.12.3,there may be a bug in the latest version. When I trained the model in single-node multi-GPU environment, it...

`ws://0:0:0:0:0:0:0:1:8888` IP及端口请根据实际情况修改 @Boosneo

If you want, you can download the compiled wheels from [https://github.com/zipzou/flash-attention/releases/tag/v2.8.2](https://github.com/zipzou/flash-attention/releases/tag/v2.8.2) before this PR has been merged.

@tridao Hi, Tri Dao, Could I ask if there is a plan to reiview and merge this PR?

`-m`参数和你训练时使用的模型一致吗?

但是看这个报错,像是你指定了captcha模型的参数pkl文件,但是使用了kaptcha模型结构,导致模型参数不能正确加载,你这边再检查下吧,看报错肯定是模型和参数文件不匹配,conv2 32x16x5x5 属于captcha模型的参数shape。