nameless0704

Results 17 comments of nameless0704

> model codellama-13b-sql-sft has the problem,can not format output according to the instruction. change another model should work Would you happen to have any recommendations on Chinese open-source models that...

xxx.xx.xxx.xxx服务器是连接互联网的吗?本地和xxx.xx.xxx.xxx服务器能ping通吗?

一方面好像是ChatYuan本身不支持stream_chat,有人在clueai那边提了issue他们说还没开发,所以估计这个attribute调不起来;但是另一方面看报错好像是T5模型本身就不是decoder-only模型,所以不能流式输出吧(个人理解)

> 请按照readme的办法跳过安装deepspeed,或者按照报错信息设置环境变量后装上deepspeed。 可以跳过deepspeed安装,但是用huggingface调模型的时候还是需要SAT,然后SAT还是需要deepspeed...

同问,想知道 [https://huggingface.co/SkyWork/SkyTextTiny](url)这个小版本的finetune需要多少资源