MedicalGPT
MedicalGPT copied to clipboard
老师您好,想请教您个问题。就是给大模型灌输垂直领域的知识,采用PT的效果好还是sft的效果好呀。数据量大约只有1.5GB的量。
老师您好,想请教您个问题。就是给大模型灌输垂直领域的知识,采用PT的效果好还是sft的效果好呀。数据量大约只有1.5GB的量。
看你数据格式化,qa的格式用sft; text格式用pt
看你数据格式化,qa的格式用sft; text格式用pt
我看以前论文说,sft无法让大模型学的多少新的垂直领域知识 这是真的码
sft死记硬背是没问题的,不过现在底模很强了,没啥垂直领域知识一定要pt加进去,用rag的方法更具有性价比。