VulnHuntr: LLM与SAST结合的AI产品漏洞自动化挖掘技术详解<\/h1>

1. 项目概述<\/h2>
VulnHuntr是一个结合静态应用程序安全测试(SAST)和大语言模型(LLM)的自动化漏洞挖掘工具，专门用于检测AI产品中的安全漏洞。该项目由Protect AI开发，已在多个AI bug bounty平台成功发现多个0day漏洞。<\/p>

核心特点<\/h3>

双重分析机制<\/strong>：结合静态代码分析和LLM智能分析<\/li>
多漏洞检测<\/strong>：支持LFI、RCE、SSRF、AFO、SQLI、XSS、IDOR等漏洞类型<\/li>
上下文感知<\/strong>：通过静态分析获取精确的上下文代码信息<\/li>

渐进式分析<\/strong>：采用多层次分析策略提高准确性<\/li> <\/ul>
2. 技术架构<\/h2>
2.1 整体工作流程<\/h3>

项目获取<\/strong>：从GitHub仓库下载待分析项目<\/li>
预处理阶段<\/strong>：

过滤无关文件<\/li>
识别网络相关代码文件<\/li>
提取项目README信息<\/li> <\/ul> <\/li>
初始分析<\/strong>：进行初步漏洞筛查<\/li>
二次分析<\/strong>：

LLM请求更多相关代码上下文<\/li>
静态分析精确获取上下文信息<\/li>
结合上下文进行深入漏洞分析<\/li> <\/ul> <\/li>
结果生成<\/strong>：输出可攻击的POC和置信度评分<\/li> <\/ol>
2.2 项目结构<\/h3>
vulnhuntr\/ ├── .devcontainer\/ # 开发容器配置 ├── vulnhuntr\/ # 主要源代码目录 │ ├── __init__.py │ ├── __main__.py # 主入口文件 │ ├── LLMs.py # LLM模型相关实现 │ ├── prompts.py # 提示词模板 │ └── symbol_finder.py # 代码符号提取器 ├── .env.example # 环境变量示例文件 ├── Dockerfile # Docker构建文件 ├── pyproject.toml # 项目配置文件 └── requirements.txt # 依赖包列表 <\/code><\/pre> 3. 核心实现细节<\/h2> 3.1 预处理阶段<\/h3> RepoOps类<\/h4> 负责项目预处理操作，关键方法：<\/p> get_readme_content()<\/code>：提取项目描述信息<\/li> get_relevant_py_files()<\/code>：过滤无关文件<\/li> get_network_related_files()<\/code>：识别网络相关代码<\/li> <\/ul> 网络相关代码识别规则<\/strong>：<\/p> # 识别各种Web框架的路由标识<\/span> <\/span><\/span>ROUTE_PATTERNS =<\/span> [ <\/span><\/span> r<\/span>'@app\.route$.*$'<\/span>, # Flask<\/span> <\/span><\/span> r<\/span>'@router\.'<\/span>, # FastAPI<\/span> <\/span><\/span> r<\/span>'@.+\.route$.*$'<\/span>, # 通用装饰器<\/span> <\/span><\/span> r<\/span>'urlpatterns\s*=\s*<\/span> <\/span><\/span>$$<\/span> <\/span><\/span>.*<\/span> <\/span><\/span>$$<\/span> <\/span><\/span>' # Django<\/span> <\/span><\/span>] <\/span><\/span><\/code><\/pre>SymbolExtractor类<\/h4> 使用Jedi静态分析框架提取代码符号，实现三层搜索策略：<\/p> 文件级搜索<\/strong>：在当前文件中查找符号定义<\/li> 项目级搜索<\/strong>：在整个项目中查找符号定义<\/li> 全局名称搜索<\/strong>：使用全局名称进行上下文检索<\/li> <\/ol> 3.2 分析阶段<\/h3> 初始分析(Initial Analysis)<\/h4> 目标：初步筛查可能的漏洞点<\/p> 提示词结构<\/strong>：<\/p> <file_code><\/span> <\/span><\/span>{待分析的完整代码} <\/span><\/span><\/file_code><\/span> <\/span><\/span> <\/span><\/span><instructions><\/span> <\/span><\/span>{检查的sinks列表} <\/span><\/span>{强调需要从API endpoints开始分析} <\/span><\/span>{允许请求更多上下文代码} <\/span><\/span><\/instructions><\/span> <\/span><\/span> <\/span><\/span><analysis_approach><\/span> <\/span><\/span>1. 全面审计指导 <\/span><\/span>2. 漏洞扫描规则 <\/span><\/span>3. 代码调用路径分析 <\/span><\/span>4. 安全限制绕过思路 <\/span><\/span>5. 上下文敏感分析 <\/span><\/span><\/analysis_approach><\/span> <\/span><\/span> <\/span><\/span><guidelines><\/span> <\/span><\/span>{输出格式要求} <\/span><\/span><\/guidelines><\/span> <\/span><\/span> <\/span><\/span><response_format><\/span> <\/span><\/span>{预期的响应格式} <\/span><\/span><\/response_format><\/span> <\/span><\/span><\/code><\/pre>二次分析(Secondary Analysis)<\/h4> 采用多轮次渐进式分析策略（最多7轮）：<\/p> 第一轮特点<\/strong>：<\/p> 不引入初始分析结果<\/li> 不请求上下文代码<\/li> 专注于特定漏洞类型分析<\/li> <\/ul> 后续轮次特点<\/strong>：<\/p> 引入前一轮分析结果<\/li> 根据需求获取上下文代码<\/li> 结合上下文进行更精确分析<\/li> <\/ul> 分析终止条件<\/strong>：<\/p> 没有新的上下文代码请求<\/li> 重复请求相同上下文代码<\/li> 达到最大迭代次数(7次)<\/li> <\/ol> 3.3 提示词工程<\/h3> README摘要提示词<\/h4> README_SUMMARY_PROMPT_TEMPLATE =<\/span> """ <\/span><\/span><\/span>请分析以下项目的README文件内容，提取关键信息： <\/span><\/span><\/span>1. 项目的主要功能 <\/span><\/span><\/span>2. 使用的关键技术 <\/span><\/span><\/span>3. 安全相关配置 <\/span><\/span><\/span>4. 其他重要信息 <\/span><\/span><\/span> <\/span><\/span><\/span>README内容： <\/span><\/span><\/span><\/span>{readme_content}<\/span> <\/span><\/span><\/span>"""<\/span> <\/span><\/span><\/code><\/pre>系统提示词<\/h4> SYS_PROMPT_TEMPLATE =<\/span> """ <\/span><\/span><\/span>你是一个专业的安全分析工具，任务是检测Python项目中的安全漏洞。 <\/span><\/span><\/span>需要分析的漏洞类型包括： <\/span><\/span><\/span>- LFI (本地文件包含) <\/span><\/span><\/span>- RCE (远程代码执行) <\/span><\/span><\/span>- SSRF (服务器端请求伪造) <\/span><\/span><\/span>- AFO (任意文件操作) <\/span><\/span><\/span>- SQLI (SQL注入) <\/span><\/span><\/span>- XSS (跨站脚本) <\/span><\/span><\/span>- IDOR (不安全的直接对象引用) <\/span><\/span><\/span> <\/span><\/span><\/span>分析时请特别注意： <\/span><\/span><\/span>1. 关注可远程利用的漏洞 <\/span><\/span><\/span>2. 检查数据流从source到sink的完整路径 <\/span><\/span><\/span>3. 考虑各种可能的绕过方式 <\/span><\/span><\/span>"""<\/span> <\/span><\/span><\/code><\/pre>漏洞特定提示词(以RCE为例)<\/h4> RCE_PROMPT =<\/span> """ <\/span><\/span><\/span>请检查以下代码中的远程代码执行漏洞： <\/span><\/span><\/span>1. 查找危险函数调用(如os.system, subprocess.Popen等) <\/span><\/span><\/span>2. 分析用户输入是否未经充分过滤就传递给这些函数 <\/span><\/span><\/span>3. 检查是否存在命令拼接情况 <\/span><\/span><\/span>4. 评估现有的安全防护措施是否可绕过 <\/span><\/span><\/span> <\/span><\/span><\/span>重点关注以下代码片段： <\/span><\/span><\/span><\/span>{code_snippet}<\/span> <\/span><\/span><\/span> <\/span><\/span><\/span><\/span>{context_code_section}<\/span> <\/span><\/span><\/span>"""<\/span> <\/span><\/span><\/code><\/pre>4. 技术亮点<\/h2> 4.1 LLM与SAST的协同机制<\/h3> LLM的优势利用<\/strong>：<\/p> 理解复杂代码逻辑<\/li> 识别非常规漏洞模式<\/li> 生成潜在攻击路径<\/li> <\/ul> <\/li> SAST的优势利用<\/strong>：<\/p> 精确获取代码上下文<\/li> 提供准确的数据流分析<\/li> 减少LLM的幻觉问题<\/li> <\/ul> <\/li> <\/ol> 4.2 渐进式分析策略<\/h3> 广度优先<\/strong>：初始分析快速筛查潜在问题点<\/li> 深度优先<\/strong>：二次分析针对特定漏洞深入检查<\/li> 动态上下文<\/strong>：按需获取相关代码上下文<\/li> <\/ol> 4.3 多模型支持<\/h3> 支持多种LLM模型：<\/p> Claude<\/li> ChatGPT<\/li> Ollama<\/li> <\/ul> 5. 局限性及改进方向<\/h2> 5.1 当前局限性<\/h3> 上下文获取不全<\/strong>：Jedi静态分析有时无法获取完整上下文<\/li> 结果不稳定<\/strong>：LLM分析存在一定随机性<\/li> 数据流分析不足<\/strong>：依赖LLM进行数据流分析可能不准确<\/li> Python类型系统<\/strong>：动态类型导致分析困难<\/li> <\/ol> 5.2 改进建议<\/h3> 增强静态分析<\/strong>：<\/p> 结合多种静态分析工具(如Semgrep, CodeQL)<\/li> 实现更精确的数据流分析<\/li> <\/ul> <\/li> 优化LLM交互<\/strong>：<\/p> 引入确定性更高的分析模式<\/li> 增加人工审核接口<\/li> 实现结果验证机制<\/li> <\/ul> <\/li> 扩展语言支持<\/strong>：<\/p> 增加对JavaScript\/TypeScript的支持<\/li> 支持Java等静态类型语言<\/li> <\/ul> <\/li> 性能优化<\/strong>：<\/p> 实现增量分析<\/li> 优化上下文缓存机制<\/li> <\/ul> <\/li> <\/ol> 6. 实践案例<\/h2> 6.1 使用示例<\/h3> # 基本用法<\/span> <\/span><\/span>python -m vulnhuntr -r \/path\/to\/project <\/span><\/span> <\/span><\/span># 指定分析特定文件<\/span> <\/span><\/span>python -m vulnhuntr -r \/path\/to\/project -a src\/api.py <\/span><\/span> <\/span><\/span># 使用不同LLM模型<\/span> <\/span><\/span>python -m vulnhuntr -r \/path\/to\/project --llm chatgpt <\/span><\/span><\/code><\/pre>6.2 典型输出结构<\/h3> { <\/span><\/span> "file_path"<\/span>: "src\/api.py"<\/span>, <\/span><\/span> "vulnerabilities"<\/span>: [ <\/span><\/span> { <\/span><\/span> "type"<\/span>: "RCE"<\/span>, <\/span><\/span> "location"<\/span>: "line 42"<\/span>, <\/span><\/span> "confidence"<\/span>: 0.85<\/span>, <\/span><\/span> "description"<\/span>: "Potential command injection via user-controlled input"<\/span>, <\/span><\/span> "poc"<\/span>: "curl -X POST http:\/\/target.com\/api -d 'input=;id'"<\/span>, <\/span><\/span> "context_codes"<\/span>: [ <\/span><\/span> { <\/span><\/span> "file"<\/span>: "src\/utils.py"<\/span>, <\/span><\/span> "symbol"<\/span>: "sanitize_input"<\/span>, <\/span><\/span> "code"<\/span>: "def sanitize_input(input): ..."<\/span> <\/span><\/span> } <\/span><\/span> ] <\/span><\/span> } <\/span><\/span> ] <\/span><\/span>} <\/span><\/span><\/code><\/pre>7. 总结与展望<\/h2> VulnHuntr代表了AI辅助安全分析的前沿方向，通过巧妙结合传统静态分析与现代LLM技术，实现了更智能的漏洞挖掘能力。其核心价值在于：<\/p> 自动化程度高<\/strong>：减少人工审计工作量<\/li> 覆盖面广<\/strong>：能发现传统工具遗漏的漏洞<\/li> 可解释性强<\/strong>：提供详细的漏洞分析过程<\/li> <\/ol> 未来发展方向可能包括：<\/p> 结合动态分析技术<\/li> 支持更多编程语言<\/li> 集成到CI\/CD流程<\/li> 开发IDE插件形式<\/li> <\/ul> 8. 参考资料<\/h2> Protect AI官方介绍<\/a><\/li> GitHub项目仓库<\/a><\/li> Jedi静态分析框架<\/a><\/li> Jedi文档<\/a><\/li> <\/ol>

VulnHuntr: LLM与SAST结合的AI产品漏洞自动化挖掘技术详解<\/h1>

1. 项目概述<\/h2> VulnHuntr是一个结合静态应用程序安全测试(SAST)和大语言模型(LLM)的自动化漏洞挖掘工具，专门用于检测AI产品中的安全漏洞。该项目由Protect AI开发，已在多个AI bug bounty平台成功发现多个0day漏洞。<\/p>

2. 技术架构<\/h2>

3. 核心实现细节<\/h2>

3.1 预处理阶段<\/h3>

3.2 分析阶段<\/h3>

3.3 提示词工程<\/h3>

4. 技术亮点<\/h2>

5. 局限性及改进方向<\/h2>

6. 实践案例<\/h2>

8. 参考资料<\/h2> Protect AI官方介绍<\/a><\/li> GitHub项目仓库<\/a><\/li> Jedi静态分析框架<\/a><\/li> Jedi文档<\/a><\/li> <\/ol>

1. 项目概述<\/h2>
VulnHuntr是一个结合静态应用程序安全测试(SAST)和大语言模型(LLM)的自动化漏洞挖掘工具，专门用于检测AI产品中的安全漏洞。该项目由Protect AI开发，已在多个AI bug bounty平台成功发现多个0day漏洞。<\/p>

8. 参考资料<\/h2>

Protect AI官方介绍<\/a><\/li>
GitHub项目仓库<\/a><\/li>
Jedi静态分析框架<\/a><\/li>
Jedi文档<\/a><\/li> <\/ol>