DSI-transformers
DSI-transformers copied to clipboard
提问
您好!我想在10k数据集(使用t5-large)上复现的话,请问max_steps这个参数是不是可以调低?我设置max_steps=27000(大约运行50个epoch)只能达到hits@1=0.18,hit@10=0.31的结果,无法达到论文中的结果 另外还想请教一下,我只有一个A100的卡可用,我跑哪个大小数据集好一些?多少个epochs比较合理呢?