上一篇文章发布后,不少朋友私信询问我本地运行LLM并供AI Agent调用的具体方案。本期就结合ROG 幻 X 2025(128GB 版本)硬件环境,完整演示L...
https://www.kaggle.com/competitions/arc-prize-2026-arc-agi-3/code
GPT-4.5 和 Claude Sonnet 在代码补全任务上已经接近人类程序员水平。然而,当对话式 LLM Coding Agent(如 Claude Co...
在前七讲里,我们从攻击技术(Series 01-03)、到供应链风险和持续性威胁(Series 04-05)、到事件响应和治理框架(Series 06-07),...
这一讲专门讨论 LLM 安全事件的响应与处置:告警响应流程的设计、临时限速与永久封禁的决策权衡、取证与数据保留的完整性要求、账户恢复与攻击者追踪的实战方法、以及...
https://github.com/heidsoft/heidsoft-nids
很多人理解 HTTP 请求的时候,会把它想象成一封信——你写好信纸,装进信封,邮局会把这封信完整地送到收件人手里。但实际的网络传输不是这样的。
2024 年 11 月 18 日,OWASP 发布了 2025 版 Top 10 LLM 安全风险清单,标志着AI安全从防漏洞向管生命周期的质变。。
上一组最后一篇按 fit()走完了一轮 PPO/GRPO step。进入第二组,我们换一个视角:同一轮 step 里有 actor、rollout、refere...
在开发「语义显微镜 V3.0」和「brainproto 类脑原型」两个项目的过程中,验证了一个结论:
我们耗时多轮迭代,持续优化 LLM 自动修 Bug 流水线,从数据喂入、评分机制、Bug 分类到任务调度,完成了全链路架构优化。所有前置工程问题悉数解决,流水线...
vibe-trading 是一个让 LLM 用自然语言驱动量化研究 + 受控实盘的 Agent 平台——它把 18 个数据源、450+ 公式 alpha、9 家...
当我几周前发布了 Neuron AI 官方路由包后,我收到了来自许多开发者的相同问题,只是措辞不同:它能将困难的请求发送给强大模型,而将简单的请求发送给便宜模型...
如果你正在频繁调用大模型API,你一定对“Token消耗”这件事又爱又恨——爱的是它让智能触手可及,恨的是它像水流一样悄无声息地溜走。
AI可见性营销(AI Visibility Marketing)还处在一个很早期的阶段。与SEO相比,它最大的不同在于,我们几乎无法看到模型内部究竟如何做出判断...
今天这篇论文「Agentic Auto-Scheduling: An Experimental Study of LLM-Guided Loop Optimiz...
Langfuse 的在线评测核心是 LLM-as-Judge——也就是用一个大模型当裁判,来看你 Agent 的输出并打分。裁判自己也是个 LLM,所以你得先把...