DeepAudit icon indicating copy to clipboard operation
DeepAudit copied to clipboard

分析结果幻觉 & 分析文件数量与项目文件数不匹配 & token消耗统计问题

Open chaos-zhu opened this issue 2 weeks ago • 12 comments

使用模型:Claude-4.5-opus

分析文件数

  • 在分析前在设置中已经设置为500,但是分析报告中的结果和页面上显示的扫描文件数不全
59文件数

13已分析
审计指标
分析文件数: 13 / 59
Agent 迭代次数: 4
工具调用次数: 3
Token 消耗: 9,425
生成的 PoC: 4

这里【Token 消耗】统计应该是有点问题的,在API后台查看,消耗在100k Token左右

分析结果

  • 这是一个不存在的漏洞,原因是分析文件中并无这行代码,所采用的数据也并非SQL。

  • 可能是因为读取不全导致,但是理论不应该出现并不存在代码的安全问题

严重 (Critical) 漏洞
CRITICAL-1: Sql Injection in routes.js
[已验证] [含 PoC] | 类型: sql_injection

AI 置信度: 100%

漏洞描述:

用户输入的 name 和 email 参数直接拼接到 INSERT 语句中。攻击者可以注入 SQL 代码来修改或删除数据库。

Impact: 攻击者可以执行任意SQL查询,导致数据泄露、数据修改、数据删除或数据库完全compromise

漏洞代码:

const query = `INSERT INTO users (name, email) VALUES ('${name}', '${email}')`;

chaos-zhu avatar Dec 16 '25 05:12 chaos-zhu

正在排查

lintsinghua avatar Dec 16 '25 06:12 lintsinghua

  1. 分析文件数量问题,应该是Agent自行决定分析哪些文件,如果要全量扫描,可用快速扫描模式,并且配置要扫描的文件
  2. Token 消耗问题,当前只是预估,后续优化修复
  3. 幻觉问题,正在通过加强RAG功能进行修复

lintsinghua avatar Dec 16 '25 06:12 lintsinghua

同款问题;

文件数量在高级设置中已经选了部分文件,但还是只分析1/3左右。是不是prompt或者agent需要优化下~

zuogod avatar Dec 16 '25 07:12 zuogod

同款问题;

文件数量在高级设置中已经选了部分文件,但还是只分析1/3左右。是不是prompt或者agent需要优化下~

好的

lintsinghua avatar Dec 16 '25 07:12 lintsinghua

分析文件数量经排查,是指含有漏洞的文件数量,非扫描数量

如:15/200 指有15个文件发现了漏洞,而非只分析了15个文件

已在新版本中更新显示,以免造成误导

lintsinghua avatar Dec 16 '25 17:12 lintsinghua

幻觉好重,opus4.5都出现了,分析出来的漏洞结果每次都有不存在的代码或者依赖

zuogod avatar Dec 17 '25 10:12 zuogod

幻觉好重,opus4.5都出现了,分析出来的漏洞结果每次都有不存在的代码或者依赖

尝试更换嵌入模型

lintsinghua avatar Dec 17 '25 11:12 lintsinghua

同样幻觉好严重,使用deepseek v3.2 + Qwen/Qwen3-Embedding-4B,出现了大量没有的文件,然后很多问题都在这些文件里

tusik avatar Dec 19 '25 09:12 tusik

同样幻觉好严重,使用deepseek v3.2 + Qwen/Qwen3-Embedding-4B,出现了大量没有的文件,然后很多问题都在这些文件里

是否方便贴出幻觉结果?

我用qwen,glm等模型测试还未出现幻觉问题。如果方便请给出测试结果,以助于团队优化系统,感谢!

lintsinghua avatar Dec 19 '25 09:12 lintsinghua

同样幻觉好严重,使用deepseek v3.2 + Qwen/Qwen3-Embedding-4B,出现了大量没有的文件,然后很多问题都在这些文件里

是否方便贴出幻觉结果?

我用qwen,glm等模型测试还未出现幻觉问题。如果方便请给出测试结果,以助于团队优化系统,感谢!

https://gist.github.com/tusik/4c9f8ae1640bf1d550ac4aeee888c778

这是一个rust混合html项目仅有一个cpp_checker.py文件

  • HIGH-1 到 HIGH-7 文件不存在
  • HIGH-9 到 HIGH-10 也不存在,而且这个项目没有数据库
  • MEDIUM-1 到 3 也不存在
  • LOW-1 到LOW-3对的,但是代码块标记为python(模型问题可以理解)

tusik avatar Dec 19 '25 09:12 tusik

好的,非常感谢 @tusik

lintsinghua avatar Dec 19 '25 09:12 lintsinghua

幻觉问题已修复: b0f17d50db35513d9575f3a8f4fb4d3b8e1f0121 80704fdcb4d55d58bfa69ee0a52ae5f4c492a14b

lintsinghua avatar Dec 19 '25 11:12 lintsinghua