aliendao icon indicating copy to clipboard operation
aliendao copied to clipboard

请求增加bigcode/starcoderdata的镜像

Open ZhichaoDuan opened this issue 10 months ago • 6 comments

请求增加bigcode/starcoderdata的镜像

ZhichaoDuan avatar Apr 23 '24 10:04 ZhichaoDuan

已增加

little51 avatar Apr 25 '24 04:04 little51

已增加

暂时还没看到诶,请问是同步需要时间吗~

ZhichaoDuan avatar Apr 25 '24 10:04 ZhichaoDuan

在datasets中,不在models中。https://aliendao.cn/datasets/bigcode/starcoderdata

little51 avatar Apr 26 '24 00:04 little51

感谢感谢,还有就是能否再添加一下https://huggingface.co/datasets/cerebras/SlimPajama-627B这个数据集,主要是想跟着tinyllama的训练步骤走一次,麻烦了~

ZhichaoDuan avatar Apr 26 '24 02:04 ZhichaoDuan

太大了,一个多T,直接从https://hf-mirror.com/datasets/cerebras/SlimPajama-627B下载吧

little51 avatar Apr 27 '24 01:04 little51

主要是他这个镜像下载会出问题,直接git clone没有反应

ZhichaoDuan avatar Apr 28 '24 07:04 ZhichaoDuan