MedicalGPT icon indicating copy to clipboard operation
MedicalGPT copied to clipboard

老师您好,想请教您个问题。就是给大模型灌输垂直领域的知识,采用PT的效果好还是sft的效果好呀。数据量大约只有1.5GB的量。

Open mingzhang798 opened this issue 9 months ago • 3 comments

老师您好,想请教您个问题。就是给大模型灌输垂直领域的知识,采用PT的效果好还是sft的效果好呀。数据量大约只有1.5GB的量。

mingzhang798 avatar Jul 28 '25 02:07 mingzhang798

看你数据格式化,qa的格式用sft; text格式用pt

shibing624 avatar Jul 28 '25 02:07 shibing624

看你数据格式化,qa的格式用sft; text格式用pt

我看以前论文说,sft无法让大模型学的多少新的垂直领域知识 这是真的码

lycaste avatar Aug 08 '25 08:08 lycaste

sft死记硬背是没问题的,不过现在底模很强了,没啥垂直领域知识一定要pt加进去,用rag的方法更具有性价比。

shibing624 avatar Sep 02 '25 07:09 shibing624