somebody101010

Results 7 comments of somebody101010

好的,谢谢您!我测试下看看速度和效果怎么样

![image](https://github.com/sunny2109/SAFMN/assets/151607896/c273f9b1-2471-4013-ae00-d8a2d76e647e) 您好,运行这个模型的demo程序报错,请问怎么回事,您那边遇到过么?我分别在2080和M40两种卡上测试都报相同的问题 Unsupported operator aten::div encountered 12 time(s) Unsupported operator aten::adaptive_max_pool2d encountered 6 time(s) Unsupported operator aten::gelu encountered 18 time(s) Unsupported operator aten::mul encountered 6 time(s) Unsupported operator aten::add encountered...

> > 好的,谢谢您!我测试下看看速度和效果怎么样 > > 小模型是在Bicubic退化下训练的,在真实场景下效果一般。您可以用您的数据重新训一个,训练过程如果出现nan的话,可以加clip_grad。 抱歉我很愚钝,没找到训练的参考代码,您方便给个链接么

> > > > 好的,谢谢您!我测试下看看速度和效果怎么样 > > > > > > > > > 小模型是在Bicubic退化下训练的,在真实场景下效果一般。您可以用您的数据重新训一个,训练过程如果出现nan的话,可以加clip_grad。 > > > > > > 抱歉我很愚钝,没找到训练的参考代码,您方便给个链接么 > > 训练脚本请参考[主页](https://github.com/sunny2109/SAFMN/tree/main)的Training部分,修改对应的配置文件就行。 哦哦,看到了,抱歉只翻代码来着,不好意思,多谢啦

> > ![image](https://private-user-images.githubusercontent.com/151607896/323481755-c273f9b1-2471-4013-ae00-d8a2d76e647e.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MTM0MjgxODQsIm5iZiI6MTcxMzQyNzg4NCwicGF0aCI6Ii8xNTE2MDc4OTYvMzIzNDgxNzU1LWMyNzNmOWIxLTI0NzEtNDAxMy1hZTAwLWQ4YTJkNzZlNjQ3ZS5wbmc_WC1BbXotQWxnb3JpdGhtPUFXUzQtSE1BQy1TSEEyNTYmWC1BbXotQ3JlZGVudGlhbD1BS0lBVkNPRFlMU0E1M1BRSzRaQSUyRjIwMjQwNDE4JTJGdXMtZWFzdC0xJTJGczMlMkZhd3M0X3JlcXVlc3QmWC1BbXotRGF0ZT0yMDI0MDQxOFQwODExMjRaJlgtQW16LUV4cGlyZXM9MzAwJlgtQW16LVNpZ25hdHVyZT1jNDg0YTA0YWJhMDQ2MjQ5NDgwNzMyMDEwZTg2YjRlOGE3YTAzMTI5Y2Q1OTBkMzE3ZWI3NTM0NjFmNGZmNDFjJlgtQW16LVNpZ25lZEhlYWRlcnM9aG9zdCZhY3Rvcl9pZD0wJmtleV9pZD0wJnJlcG9faWQ9MCJ9.zKbUWOBxPKj3mowQ3ySmUBMpGUBEvyChnbhly3VzZCA) 您好,运行这个模型的demo程序报错,请问怎么回事,您那边遇到过么?我分别在2080和M40两种卡上测试都报相同的问题 Unsupported operator aten::div encountered 12 time(s) Unsupported operator aten::adaptive_max_pool2d encountered 6 time(s) Unsupported operator aten::gelu encountered 18 time(s) Unsupported operator aten::mul encountered 6 time(s) Unsupported operator...

在请教下,23这个小模型,重新训练的话用多少组数据训练比较合适?另外yam文件您方便给一下吗?有些参数不确定改的对不对,谢谢!

> docker compose down -v (remove all the local data) docker compose up it works !thanks