P-tuning-v2 icon indicating copy to clipboard operation
P-tuning-v2 copied to clipboard

[Help] 如何通过微调提升 text2sql 能力?

Open xiaotianhxf opened this issue 2 years ago • 2 comments

求助:如何通过微调提升模型的text2sql能力?

  1. 如何给模型注入库表信息、业务知识?
  2. 如何校正模型输出的SQL?

当前给出一个建表语句(比如一张用户登录日志表),再问一个问题(比如 当天的DAU是多少), chatglm会给出错误的sql语句。 比如加了一些无关的字段、sql关键字之间没有空格、用户没有去重等

期望通过微调,提升模型的text2sql能力。

期望注入:

  1. 建库建表语句
  2. 表字段的关联关系: 比如A.a = B.b
  3. 业务知识: 比如投资roi怎么计算

问题:

  1. 今天XX的DAU是多少
  2. 最近7天XX的roi是多少

输出: select count(distinct yourid) from your_table where date = today()

从your_table表查询XX的DAU, 以yourid字段作为用户的唯一标识,以date字段作为过滤时间。通过count(distinct yourid)进行去重统计,date=today() 指定为今天。

xiaotianhxf avatar Apr 15 '23 01:04 xiaotianhxf

我也想知道,有没有大佬指导下

highroom avatar May 20 '23 13:05 highroom

可以关注一下DB-GPT-HUB项目,https://github.com/csunny/DB-GPT-Hub

zhanghy-sketchzh avatar Jul 08 '23 08:07 zhanghy-sketchzh