Songhua Yang

Results 23 comments of Songhua Yang

这是一个刚刚发布的基于 LLaMA 的LLM,您可以看一下这篇文章:https://www.jiqizhixin.com/articles/2023-05-17-6

与您的工作非常相似,而且该文声称他们的模型超过了您

明白,感谢您的耐心回复。

I think you need to update your code to compatible with new version transformers.

Thank you. Excuse me, is the default experiment setup in your code is best and as same as your paper ? I compared them and found no difference.

Hello, I verify your conclusion. I run your code in 3 different device, and it's right that the experiment is related to the machine enviroment. 😭 And can you tell...

作者不回复我,但是我还是想说,我跑了 10 次,只有 1 次能在res16上能跑到 0.68。。。期待其他同学能够复现该模型,一起交流一下。

> 你好,我跑了1次,最好的是0.67070 差不多,作者应该是专门调结果了,说的是平均,其实就是跑了 10 次取最好的。

> > 作者不回复我,但是我还是想说,我跑了 10 次,只有 1 次能在res16上能跑到 0.68。。。期待其他同学能够复现该模型,一起交流一下。 > > 你好,最近我也在复现该模型,我们可以留下联系方式交流下吗 wx:SupritYoung