
团队就两个能做代码审查的人,PR排队是常态。等人review的时间比写代码还长。
传统CI能抓语法错误和测试失败,但逻辑漏洞、安全隐患这类问题经常溜进生产环境。新人提交的代码可能违反团队规范,但资深成员未必及时覆盖。
所以花了两天时间,用Claude Code和Claude API搭了一个私有审查机器人。所有代码和审查数据都留在本地,不上传到任何第三方平台。用了两周,把踩坑经验整理出来。
三个原因:数据主权、无限定制、零依赖外部服务。
金融和医疗领域的代码绝对不能离开内网。现成工具的审查模板是通用的,没法注入你公司的编码规范和遗留系统迁移规则。私有方案只需为API调用付费,没有中间平台抽成。
这是整个方案中最关键但最容易被忽视的一步。
很多人把CLAUDE.md当成一个越长越好的文件,把能想到的项目规范全塞进去。结果Claude在规则堆里迷路,实际效果反而变差。
真正高质量的CLAUDE.md应该是精准的,而不是全面的。
核心原则叫"Litmus Test"——对每一行问自己:没有这行,Claude会犯具体的错误吗?如果不会,删掉。"写干净的代码"是废话,"所有数据库查询必须按tenantId过滤"才是有价值的规则。
经验数据:理想长度60行以内,硬性上限200行。Claude Code创建者Boris Cherny的解释是,前沿LLM可靠执行的指令大约150到200条,系统提示已经占了约50条,留给用户的空间不多。
Claude Code在每次会话启动时会自动加载CLAUDE.md,成为它理解"这个项目"的基础上下文。这意味着你不需要反复叮嘱,规则写一次永久生效。
写的时候要注意:写指令,不写描述。"使用Next.js 15"是指令,"我们通常偏好函数式编程模式"是描述,后者对Claude没有可操作性。
Boris的团队把CLAUDE.md纳入Git版本控制。逮到Claude犯错就记进去,下次它就不会在同一个坑里跌倒两次。这种"复利工程学"让配置文件越用越精准。
基础提示词"Review this code"产出质量很差。需要给Claude一个结构化的审查框架。
我用的是四维结构:安全性(SQL注入、XSS、硬编码密钥)、逻辑正确性(空指针、边界条件)、性能(N+1查询、不必要的循环)、代码质量(命名规范、函数长度)。
一个经过验证的模板:"你是一位有10年经验的高级后端工程师,擅长发现并发Bug和安全漏洞。请审查以下代码,从正确性、并发安全、错误处理、性能、安全性五个维度检查。每个问题标注严重等级(高/中/低)和修复建议。"
为什么有效?三个原因:设定专家身份激活模型相关知识权重;明确审查维度相当于给模型一个检查清单;结构化输出约束了思考过程。
温度参数设为0.1到0.3,减少随机性。代码审查场景你不想同一个PR审两次结果完全不同。
关键设计选择:只专注逻辑错误,完全忽略代码风格问题。风格交给linter,Claude专注linter抓不到的东西——架构模式、业务逻辑约束、工作流指令。
CLAUDE.md可以引用自动化检查。比如声明"Pre-commit的ESLint和Prettier通过hooks自动运行",这样Claude就不会手动跑这些检查,避免重复工作。
如果你的团队同时使用Claude Code和Cursor等多种AI工具,可以把通用规则写在AGENTS.md中,然后让CLAUDE.md只保留一行:See @AGENTS.md,再加Claude专属配置。这样每个工具都读取相同的核心指令。
Claude Code有个"Agent呆滞区"——上下文超过60到70%时性能明显下降,开始忽略指令、犯低级编码错误。
经验做法:用/context监控用量,在50%时手动执行/compact压缩上下文,别等自动压缩,那时候通常已经晚了。
如果Claude跑偏了,直接按两次Esc回滚到上一个检查点。不要在同一个上下文里纠正——错误推理还在上下文里,它会被自己的错误逻辑带偏。跑偏一次回滚,同一问题跑偏两次用/clear重开。
还有一个反直觉的建议:遇到bug时只说"修复",别微操。你越指导它怎么修,越可能把它带偏。直接让它修,成功率80%以上。
当CLAUDE.md开始臃肿时,把细分规则迁移到.claude/rules/目录。每个文件可以用路径限定条件加载——在规则文件顶部添加YAML Frontmatter,指定只在处理特定文件时才加载。
这样Claude处理前端文件时不会被后端的数据库迁移规则干扰。渐进式披露能把每次会话实际加载的字数削减80%左右。
自建方案每次PR审查大约0.15到0.15到0.35,月度50个PR总费用在20到20到60范围内可控。
2026年AI代码审查已经从锦上添花变成基础设施的一部分。但架构决策、业务逻辑权衡、领域特定判断仍然需要人工。把重复性的质量保障工作自动化,让人工review只关注真正需要人脑判断的问题——这才是正确打开方式。
模型会不断被替代,但好的验证流程和Agent框架是更持久的基础设施。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。