phi3-Chinese
phi3-Chinese copied to clipboard
也许对它进行叠加block操作后很有潜力?
trafficstars
请问readme中的“也许对它进行叠加block操作后很有潜力?”具体是什么意思?
是不是:将部分层或者参数冻结后,做中文的finetune的意思?
参考腾讯实验室的 llama pro 工作
---原始邮件--- 发件人: @.> 发送时间: 2024年4月25日(周四) 下午2:30 收件人: @.>; 抄送: @.***>; 主题: [CrazyBoyM/phi3-Chinese] 也许对它进行叠加block操作后很有潜力? (Issue #3)
请问readme中的“也许对它进行叠加block操作后很有潜力?”具体是什么意思?
是不是:将部分层或者参数冻结后,做中文的finetune的意思?
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>
llama pro工作
其实phi3这次开源的是mini版,官方所指的跑分超过llama3的版本是还未开源的phi3-medium版,mini版的官方评分也还是差其他几个主流模型一点。
附