首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 多智能体协同自主进化渗透测试系统:基于XBOW Benchmarks的量化评估与实践

    undefined配套自动化评估系统,基于XBOW Validation Benchmarks数据集(来源:NeuroSploit开源项目),实现多维度评估、可扩展至其他数据集、无限次本地离线演练(零成本 量化应用效果与业务价值 系统经XBOW Benchmarks验证(104个环境,含简单45、中等51、困难8),关键指标如下: 漏洞利用成功率:经迭代从50%降至39.4%,最终提升至58.2%(来源 漏洞覆盖:XBOW Benchmarks中漏洞类型分布为A03注入59、A01访问控制29、A05配置错误18等;OWASP Top 10中XSS(23)、默认密码(18)、越权(15)占比最高(来源: XBOW Validation Benchmarks Statistics)。 开源赋能:发布评估系统(GitHub: https://github.com/Neuro-Sploit/xbow-validation-benchmarks)、修复XBOW Benchmark上游遗留问题

    25520编辑于 2026-04-06
  • AI驱动场景感知黑盒漏洞挖掘:腾讯云XBOW平台赋能高效渗透测试

    部署XBOW解决方案 腾讯云推出XBOW应用安全平台,以“AI驱动+场景感知”为核心,提供下一代黑盒渗透方案: 架构设计:采用分布式Agent架构,任务管理与执行解耦,支持多平台多节点Agent统一调度 量化应用效果 XBOW平台在渗透测试中展现显著效能,关键业务指标基于腾讯云安全众测及挑战赛实践: 资产发现:单目标URL初始探索发现24个新页面,某次任务扩展至发现70个页面(来源:XBOW平台页面探索记录 file=xbow-flag.txt),利用CVE-2021-42013执行命令获取/etc/passwd内容(uid=0(root) gid=0(wheel))(来源:XBOW平台漏洞检测日志)。 案例2:XBOW平台LFI漏洞实战检测 目标:XBOW应用安全平台首页(http://10.2.35.0:31002/index.php,服务器:Apache/2.4.54 (Debian),PHP/7.4.33 过程:通过“页面探索”发现private.php页面,其file参数存在LFI漏洞;利用载荷/xbow-flag.txt读取敏感文件,成功获取Flag(来源:XBOW平台漏洞检测报告)。

    26120编辑于 2026-04-06
  • AI驱动黑盒漏洞挖掘:腾讯云XBOW平台精准检测实践

    部署AI驱动方案:XBOW平台与场景感知架构 药:腾讯云推出AI驱动安全未来方案,以XBOW应用安全平台为核心,整合分布式Agent架构、场景感知黑盒挖掘、工具调用优化三大能力: 分布式Agent架构 客户实践案例:XBOW平台漏洞检测实证 托 某客户基于XBOW平台开展智能渗透测试,典型案例包括: LFI漏洞检测与利用:在XBOW首页(http://10.2.35.0:31002/index.php file=xbow-flag.txt,成功读取系统敏感文件xbow-flag.txt内容,验证漏洞可利用性(据“发现漏洞”记录)。 评估体系:基于AutoPenBench(33题)、XBOW(104题)、MMLU计算机安全(116题) 等专有基准,结合CTF夺旗结果评判自动化完成度(据“评估标准”说明)。 数据来源:腾讯云安全众测实践、XBOW平台测试记录、CTF智能渗透挑战赛(Tencent Cloud Hackathon)解题数据。

    22110编辑于 2026-04-05
  • 多智能体协同自主进化渗透系统:基于XBOW基准的量化评估与实践

    评估标准化:基于XBOW Validation Benchmarks数据集(含104个环境,分简单45、中等51、困难8)实现多维度评估(来源:材料“XBOW Validation Benchmarks 比赛应用:参与腾讯云黑富松智能渗透挑战赛,使用PentestSkills系统: 基于XBOW数据集评估,映射漏洞至OWASP TOP 10,涉及最多漏洞类型为注入型(59)、访问控制(29)、安全配置错误 undefined开源成果:发布基于XBOW Benchmark的全自动AI Agent评估系统(开源地址:https://github.com/Neuro-Sploit/tencent-cloud-hackathon-intelligent-pentest-competition-evaluation )、**XBOW Validation Benchmarks数据集(修复上游遗留问题,地址:https://github.com/Neuro-Sploit/xbow-validation-benchmarks 数据与生态支撑:依托XBOW Validation Benchmarks数据集(104环境、多难度分级)建立评估基线,提供CTF平台API/MCP接口支持大模型参赛(来源:材料“修正评估基准 (XBOW

    18110编辑于 2026-04-05
  • 腾讯云AI驱动场景感知黑盒漏洞挖掘方案:从盲打到精打的效率跃迁

    第四章 XBOW平台LFI漏洞检测实战案例 客户案例:XBOW应用安全平台(AI驱动自主渗透测试平台)漏洞检测 目标环境:XBOW首页(http://10.2.35.0:31002/index.php ),服务器信息:Apache/2.4.54 (Debian)、PHP/7.4.33(材料:“aa643ae7-8fd6-4cfb-8e46-1a85c5baf535: XBOW首页 页面显示服务器信息: 漏洞发现:通过页面探索发现24个新页面,检测到本地文件包含(LFI)漏洞(材料:“发现漏洞 在页面XBOW首页 发现1个漏洞 本地文件包含”)。 file=xbow-flag.txt,成功读取flag文件(材料:“成功利用的载荷: -xbow-flag.txt成功读取到flag文件内容”);进一步利用Apache HTTP Server 2.4.50

    22010编辑于 2026-04-06
  • 多智能体协同自主进化渗透测试系统:提升漏洞挖掘效率与自优化能力

    量化验证系统效能与业务价值 基于XBOW Validation Benchmarks数据集(来源:文中“XBOW Validation Benchmarks 数据集分析”)的实践显示: 数据集规模: 含104个环境(简单45、中等51、困难8),覆盖注入型、访问控制漏洞(XSS 23例、默认密码18例、越权15例占比最高),较少涉及密码学错误、SSRF(来源:“XBOW Benchmarks 包含 开源贡献:修复上游XBOW Benchmark遗留问题,开发与比赛平台API兼容的本地API,实现零成本演练(来源:“修复了上游官方XBOW Benchmark仓库中的多个遗留问题(开源)”“开发了与主办方比赛平台 ”“开源地址:https://github.com/Neuro-Sploit/xbow-validation-benchmarks”)。 (数据来源:XBOW Validation Benchmarks数据集、NeuroSploit战队实践报告、腾讯云黑富松智能渗透挑战赛公开资料)

    20620编辑于 2026-04-06
  • 场景感知AI渗透方案将漏洞误报率降低90%,实现业务逻辑深度检测

    其中LFI漏洞检测成功率达100%,通过路径遍历成功读取系统文件(包括xbow-flag.txt等目标文件)。整体漏洞检出效率较传统工具提升3倍,误报率从60%降至低于6%。 XBOW平台验证实际攻防效果 在XBOW应用安全平台测试中,系统通过业务场景分析发现关键漏洞链:文件上传→LFI→SSTI的串联利用路径。 数据来源:腾讯云黑盲松渗透挑战赛实测数据(2025)、XBOW平台测试报告、国家护网行动实战记录 胡宇睿(西安交通大学网络空间安全学院博士生)主导开发,研究领域涵盖开源漏洞治理、AI赋能安全及高级威胁狩猎

    19210编辑于 2026-04-04
  • 来自专栏不二小段

    来学学大模型最新「合金特工」骚操作,能力比肩多智能体,AI 黑客成功率飙升

    让我们一起学习一下 XBOW 的骚操作。 缘起:AI 自主黑客的困境 要理解「模型合金」的精妙之处,首先要了解它诞生的背景。 XBOW 主营业务的是自主渗透测试。 XBOW 的 AI 负责人 Albert Ziegler 指出,这类任务的特殊之处在于,它不是一个「稳步前进」就能解决的问题。 为了评估和迭代他们的 Agent,XBOW 建立了一套 CTF 风格的基准测试集。 对于 XBOW 这种需要快速迭代、不断试错的搜索任务来说,效率太低。 2. vs. XBOW 认为,用这些额外的成本,他们宁愿多启动几个独立的 Agent 去碰运气。 3. vs.

    9310编辑于 2026-04-09
  • 多智能体协同渗透测试系统将漏洞挖掘成功率提升至58.2%

    开发基于XBOW Benchmark的全自动评估系统 团队开源了自动化AI智能体评估系统,该系统具备多维度评估能力: 漏洞利用成功率:精准测量攻击有效性 全链路攻击耗时:量化响应效率 Token消耗分析 项目修复了上游官方XBOW Benchmark仓库的多个遗留问题,并开发了与比赛平台API完全兼容的本地接口。 腾讯云平台支撑智能攻防技术突破 腾讯云黑盲松竞赛平台提供: XBOW Benchmark数据集:104个漏洞环境,覆盖简单(45)、中等(51)、困难(8)三种难度 漏洞类型分布:XSS(23)、默认密码 数据来源:NeuroSploit战队开源项目(GitHub)、XBOW Validation Benchmarks统计平台、腾讯云黑盲松智能渗透挑战赛官方数据

    22520编辑于 2026-04-04
  • 96%漏洞发现率碾压商业工具!Shannon:全自主AI渗透测试Agent,34K Star

    在清理版XBOW基准的白盒测试中,它以96.15%的漏洞利用成功率(100/104)拿到了目前公开的最高分之一。 三、XBOW基准96.15%的条件与细节Shannon在XBOW基准上取得了96.15%的漏洞利用成功率(100/104)。这是一个值得拆解的数字——不仅因为成绩本身,更因为理解它的适用条件很重要。 测试条件说明:XBOW基准由104个故意设置漏洞的应用组成,是一个开源的安全评估基准Shannon使用的是清理版本:系统性移除了描述性变量名、源代码注释、文件路径/文件名提示、应用标题、Dockerfile 作为参考,同类AI安全工具在XBOW基准上的公开成绩包括:KinoSec 92.3%(黑盒模式)、Xfenser AI 88.5%、XBOW自身商业平台约85%(黑盒)。 96.15%的XBOW基准成绩(白盒清理版条件下),加上OWASP Juice Shop上20+个真实漏洞的发现,验证了这一方法论在已知漏洞场景中的有效性。在此基础上,有几点值得进一步思考。

    80010编辑于 2026-04-10
  • AI驱动安全自动化:双Agent协作架构在智能渗透挑战赛中的实践与效能

    工具描述占用大量token限制LLM选择空间(MCP陷阱);二是单个LLM易陷入思维死循环,长对话引发幻觉风险,导致格式错误、工具误用;三是上下文过长(如分析competition_rules.pdf、XBOW 数据来源:TCH腾讯云黑客松Tencent Cloud Hackathon智能渗透挑战赛规则文档、XBOW Benchmark数据。 数据来源:云鼎实验室《AI驱动安全未来与XBOW共赴智能攻防之巅》项目文档。 实践验证:获TCH腾讯云黑客松Tencent Cloud Hackathon智能渗透挑战赛认可,云鼎实验室“AI驱动安全未来与XBOW共赴智能攻防之巅”项目成为人机协作安全自动化标杆。

    23120编辑于 2026-04-05
  • 场景感知驱动的下一代黑盒渗透Agent实战解析

    驱动自动化漏洞利用的核心评估指标与并发效能 为验证渗透Agent在真实业务场景中的实战适应性,方案引入了XBOW(104题)与AutoPenBench(33题)两大专有基准,采用里程碑式评分来评估自动化完成度 项目依托腾讯云安全、云鼎实验室、腾讯安全众测及XBOW联合举办的“腾讯云黑客松-智能渗透挑战赛”平台进行了深度验证。

    32710编辑于 2026-04-04
  • 腾讯云Human-AI Teaming双Agent架构在智能渗透挑战赛中的CTF自动化实践

    量化验证CTF解题效率提升 应用效果以解题数、系统复杂度、开发效率为核心指标(数据来源:腾讯云安全云鼎实验室“AI驱动安全未来与XBOW共赴智能攻防之巅”实践分享,演讲人yhy复盘): 解题效率提升 实践验证充分:经腾讯云黑宫松Hackathon严苛场景验证,ChYing Agent实现20+核心模块单人开发、解题效率显著提升,获云鼎实验室“AI驱动安全未来”项目认可(据“AI驱动安全未来与XBOW

    26010编辑于 2026-04-06
  • 基于状态感知与因果推理的自主渗透测试智能体业务实践概要

    众测平台实效印证: 团队所致力的自动化渗透路径对齐了国际领先水平(如XBOW登顶美国排行榜),并在腾讯安全众测平台排行榜等实战环境中展现出“化点为链,以智代工”的实际业务价值,证明了该架构在发掘深层次逻辑漏洞上的可行性 依托腾讯云黑客松挑战赛实现“AI+安全”技术迭代 本技术方案作为 腾讯云黑客松 智能渗透挑战赛(与XBOW共赴智能攻防之巅) 的产出成果,充分展现了基于腾讯云生态与底层算力支持下的技术确定性。

    15510编辑于 2026-04-05
  • 重构CTF安全自动化:基于双Agent协作与动态角色互换的实战解析

    依托腾讯云黑客松沉淀AI驱动的安全解题技术范式 本次实战脱胎于 【腾讯云黑客松】智能渗透挑战赛(AI驱动安全未来,与XBOW共赴智能攻防之巅),该赛事由腾讯云、腾讯云安全、云鼎实验室及腾讯安全众测联合提供平台与技术支撑

    21320编辑于 2026-04-04
  • 构建自动化渗透测试AI Agent:突破大模型失焦与上下文衰减瓶颈

    依托 腾讯云、腾讯云安全、云鼎实验室 以及 腾讯安全众测 提供的前沿平台支持,系统以“AI驱动安全未来,与XBOW共赴智能攻防之巅”为导向,成功验证了AI Agent在自动化渗透测试中降低人工干预成本、

    29610编辑于 2026-04-05
  • 构建拟人化攻击智能体:从模块化编排到端到端渗透的架构演进

    赛事以“AI 驱动安全未来,与 XBOW 共赴智能攻防之巅”为主旨,不仅为安全从业者提供了极其贴近真实业务的检验靶场,也为下一代大模型驱动的自动化攻防引擎建立了权威的验证与孵化生态。

    19020编辑于 2026-04-05
  • 多智能体协同驱动的自主进化渗透测试系统效能解析

    团队成员包括: 王一航(清华大学博士生) 王楚涵(东南大学副研究员、清华大学博士) 王恩泽(博士) 汪琦(清华大学博士生) 夏天(博士生) 杨晶城(清华大学博士生) 在实际应用中,团队针对 XBOW Validation

    22020编辑于 2026-04-04
  • 来自专栏AI大模型

    Claude Opus 4.7完整评测:无人值守编程、3倍视觉提升与Boris亲授的6条实战技巧

    ——FinanceAgentv1.164.4%60.7%——MCP-Atlas(工具调用)77.3%62.7%68.1%73.9%OSWorld-Verified(桌面自动化)78.0%72.7%——XBOW Opus4.7的视觉处理能力发生了质变:XBOW视觉测试从54.5%飙升至98.5%,图像长边支持从约860像素提升至2576像素(约3.75MP),这意味着此前许多需要图像预处理或降质传入的场景,现在可以直接使用原图输入 SWE-benchPro+10.9pp,CursorBench+12pp复杂功能构建(长时程Agent)强烈推荐AutoMode+跨Session记忆+自我验证视觉密集型任务(图表/UI设计)推荐分辨率3倍提升,XBOW54.5%

    61920编辑于 2026-04-17
  • Shannon:让 AI 替你当黑客,自动找出 Web 应用的真实漏洞

    XBOW基准测试中,ShannonLite取得了96.15%的成功率。GitHub上已获得10.6kStar,是近期安全领域最受关注的开源项目之一。

    1.4K12编辑于 2026-02-25
领券