RWKV-LM icon indicating copy to clipboard operation
RWKV-LM copied to clipboard

关于RUN_CUDA_RWKV6这部分,最好用pytorch实现,否则不方便移植

Open bobo-wmdigit opened this issue 1 year ago • 5 comments

看了下论文的方向,挺棒的,但是整个设计对实际想进一步研究的人非常不友好,因为想用这个框架的,都是希望移植到边缘端,可是核心代码,用的又是cuda实现的,移植起来非常麻烦,还要自己手动对齐,好像除了1代都是这么干的? 我也去测试了demo,感觉对终止符的推荐也不是很好,建议这么好的理论框架,最好能够设计的更方便大家去实验,才有机会被真正落地用起来。 仅供参考。

bobo-wmdigit avatar Aug 27 '24 09:08 bobo-wmdigit