首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 标星近 15k,这个高颜值 Coding Agent 如何用 DeepSeek 缓存降低会话成本

    可能现在大家对CodingAgent的期待都不低。毕竟它能读代码、改文件、跑命令,已经很接近“把一个开发助手放进项目里”的想法。 但真正用过CodingAgent的小伙伴应该已经发现一个很现实的问题:只要任务稍微长一点,成本就很难忽略。如果只是让它解释一段代码、改一个小函数,大多数的CodingAgent体验一般都不错。 这点对CodingAgent其实很重要。因为我们用这类工具辅助开发时,看的不只是最后结果,还会关心它读了哪些文件、为什么要修改某段代码、有没有执行了危险的命令、现在任务又推进到了哪一步。 CodingAgent不只是聊天,它还要调用工具,比如读写文件、执行命令。模型在生成工具调用时,偶尔会出现格式不完整、参数不规范的问题。 这背后的思路挺现实:CodingAgent的每一轮请求,不一定都需要最强模型。有些任务只是整理工具结果、搜索代码、生成摘要,直接用pro模型反而是浪费。

    20510编辑于 2026-06-01
  • 穷鬼实测|Claude成本明显是降了,但多模型接入还是把我折腾麻了

    盘点最近热门AI开源项目:从CodingAgent到推理层,为什么开发者越来越需要统一模型接入最近在看GitHub和HackerNews上的AI开源项目时,我有一个很明显的感受:这一波热门项目,已经不只是 这时候开发者就不得不考虑:-用Claude还是GPT-哪些任务适合便宜模型先跑-哪些步骤必须强模型收口-接口切换是否顺畅-某个模型不稳定时,能不能快速替换也就是说,这类开源CodingAgent的热度越高 ---4.Frontman:浏览器内CodingAgent也是一个值得注意的趋势最近还有一类项目开始走“浏览器内AICodingAgent”路线。 ---3.成本控制已经不是附加需求,而是主需求这点在CodingAgent和自动化工作流里尤其明显。当一个Agent会持续读代码、改文件、反复推理时,调用量是会快速放大的。 从CodingAgent到推理引擎,再到模型路由,大家最终都在逼近同一个核心问题:如何把越来越强的模型能力,真正稳定、低成本地接进开发工作流。

    10200编辑于 2026-05-30
  • 长时 Agent 怎么交接班:读 Anthropic 这篇 harness 文章

    2.Codingagent后面每一轮session都用这个角色。 所以Anthropic最后干脆把规则写死:每一轮codingagent只做一个feature。 3.进度写进文件,代码写进gitAnthropic让codingagent在每轮结束前做两件事:写gitcommit更新claude-progress.txt这两个东西分工很明确。 读完以后最容易留下来的部分表面上最显眼的是“initializeragent+codingagent”。 第二,单一通用codingagent是否就是最优解,文章自己也没有下定论。

    32500编辑于 2026-04-11
  • MATLAB 和 Simulink R2026a 推出全新 Agentic AI 驱动的工作流,增强工程化系统的设计与开发

    这些工具使AI智能体(例如,CodingAgent)直接与MATLAB/Simulink交互,从而超越传统的聊天式辅助设计,迈向以行动为导向的智能型、自动化工作流。 如果缺乏相应指导,CodingAgent可能会重复实现已有的工具箱功能、忽视内置特性,或采取一些经验丰富的MATLAB或Simulink用户通常会避免的冗余步骤。 MATLABAgenticToolkit和SimulinkAgenticToolkit通过向CodingAgent提供MATLAB与Simulink工作流及使用规范的专家级知识,对MATLABMCPCoreServer

    1.2K20编辑于 2026-04-24
  • AI Coding Agent 如何工程化:从上下文污染到多 Agent 分工

    在这篇文章中,我们将从上下文管理和多Agent分工两个角度,拆解CodingAgent走向工程化时遇到的关键问题。 图注:ReviewAgent的价值,是用更干净的上下文重新看diff,发现CodingAgent在长任务路径中可能忽略的问题。 在更高层的多Agent结构里,ManagerAgent可以把较大的任务拆成多个部分,生成子CodingAgent来执行,并通过内部MCP协调进展。但这里的问题也很明显。 这也是CodingAgent工程化真正要解决的问题:模型能力决定它能不能做事,工程系统决定它能不能持续、稳定、可控地做事。

    27410编辑于 2026-05-13
  • 从Vibe Coding到Harness Engineering的实践与思考

    多次实践下来得出的结论是,codingagent的默认优化目标与架构收敛需要的动作,天然不是同一个方向。 当然,这并不意味着所有使用codingagent的项目都会以相同速度滑向同一种失配。 如果把视角再往研究侧推进一点,最近也已经出现了更直接把harness当作codingagent核心对象的工作。 结语写到这里,我对“下一阶段的AI编程工程学”有了一些初步认识,codingagent落地使用产生差距的,不会只是更早把codingagent接进研发流程,也不会只是用哪个模型,哪种模式可以快速构建出项目 那时,codingagent就不再只是屎山放大器,而开始成为架构收敛机。

    1.8K103编辑于 2026-04-02
  • 专访 Bub 作者们:如何开发一个好记性又懂人的 Agent

    它最开始其实是一个CodingAgent。去年年中的时候,命令行里的CodingAgent很火,比如AMP这种名字就很短,三个字母就能打出来。所以我当时也想找一个简短一点、又有点意思的名字。 我没有把它作为群聊工具,而是把它放进我们公司的一个项目里,当作CodingAgent来用。Bub最早就有CodingAgent的能力,也支持读skill。 因为它有一个很好的代码内核,你会发现很多人会通过Bub学习怎么做一个CodingAgent,怎么把CodingAgent变成一个通用Agent。 就像以前Kimi是一个很适合学习CodingAgent的工具,但现在Kimi已经变得非常复杂,甚至有点失控。 当时命令行里工作的CodingAgent很火,我看到AMP那篇文章,说用四个工具就可以做Agent,于是在去年年中就手写了一遍。

    12910编辑于 2026-05-31
  • 来自专栏AI Coding

    从“会写代码”到“能交付业务”:读蚂蚁 Vibe Coding 平台半年实践的一些思考

    从“会写代码”到“能交付业务”:读蚂蚁VibeCoding平台半年实践的一些思考最近认真读完了彭佩乔分享的《让每个员工都有一个CodingAgent:蚂蚁VibeCoding平台落地半年后的实践经验》, 但真正让我觉得这份分享值得反复咀嚼的,是它没有沉迷于“酷炫能力”,而是在持续回答一个更现实的问题:当越来越多真实业务开始依赖CodingAgent,平台到底会遇到什么,应该怎么演进? 这些指标,才真正决定一个CodingAgent平台有没有生产价值。总的来说,这份分享最打动我的一句潜台词是:AI不是在替代软件,而是在重写软件的生产方式。

    39920编辑于 2026-05-03
  • Andrej Karpathy Skills:给 Claude Code 加四条行为约束

    仓库里给出的要求包括:把假设说出来有歧义时,不要自己默默选一个如果有更简单的路,就主动指出来真有困惑时,停下来问这条规则放到codingagent里很重要。 再修到通过重构前后测试都必须通过两者的区别在于:前者是命令式任务后者是带校验标准的目标这里有一句话写得很直接:Don'ttellitwhattodo,giveitsuccesscriteriaandwatchitgo.这很像写给codingagentcodingagent来说,这类规则往往比“再多会一个工具”更重要。很多返工,最后都出在起手方式不对。

    4K30编辑于 2026-04-16
  • 开源项目观察|ds4:本地 Agent 推理,不只是把模型跑起来

    它不是又一个“模型加载器”,只是在试图回答一个更具体的问题:如果我们真的想把本地模型接进codingagent、toolagent或长期会话系统里,推理引擎应该长什么样? 对于普通聊天来说,只是多传一点上下文;但对于codingagent来说,初始prompt可能就很长,工具调用也会不断扩展上下文。 一套端到端的本地推理系统ds4README里有一句话很能概括它的目标:本地推理不只要一个engine,还要三件事一起工作:带HTTPAPI的推理引擎、按照ds4执行路径专门制作的GGUF文件,以及面向codingagent 它更像是把本地推理的问题往前推了一步:当模型开始接入工具、处理长上下文、服务codingagent,并在多轮任务里持续运行时,推理引擎要解决的就不只是生成速度,还包括状态管理、缓存机制、协议适配、工具调用

    37210编辑于 2026-05-12
  • [理论篇-13]AI 编程(AI Coding)—— 从"AI 帮你打字"到"AI 替你跑腿",程序员的工种正在重写

    五、AI编程到底在底层做什么:CodingAgent的"工作日"到这里你已经知道工具的全貌。下一个问题是:当一个AI在"替你写代码"的时候,它到底在做什么?这一节我们打开盖子看一眼。 5.1一天的剧本:读、改、跑、验不管是CursorAgent还是ClaudeCode还是Devin,所有CodingAgent在底层都在跑一个非常朴素的循环:展开代码语言:TXTAI代码解释┌───── 一个典型的CodingAgent工具箱:展开代码语言:TXTAI代码解释读▏Read/Glob/Grep/GitLog(打开文件、搜文件、搜内容、看历史)改▏Edit/Write/Delete(改文件、 所以2025年开始,所有主流CodingAgent都用了同一个解决方案——项目根目录里放一个"小本本":展开代码语言:TXTAI代码解释工具小本本文件名───────────────────────── 一个CodingAgent能动你的电脑——这意味着它也能干坏事。

    30400编辑于 2026-05-08
  • AI 周刊 #083 - GPT-5.5 Instant、Google Code Wiki、Claude Managed Agents 新能力

    模型与工具\\open\-slide:面向Agent的幻灯片框架\\\-仓库自述为给Agent用的slide框架,把「写稿、拆页、版式与导出」尽量结构化成机器可批量改的形态,方便在codingagent \\context\-mode:为codingagent压缩工具输出、号称上下文暴减\\\-主打在多种agent宿主上给工具输出做沙箱与摘要,减少「一条curl把整屏日志灌进窗口」式的上下文爆炸,自述在部分场景可带来数量级内的 \\Verceldeepsec:用codingagent在代码库里挖安全问题的harness\\\-把「让模型带着工具读代码、跑检查、迭代假设」封装成安全向harness,面向漏洞猎手与想在CI里加一层

    12410编辑于 2026-06-02
  • 周一上线|Codex 工程师教你自我蒸馏,吉他遥控贪吃蛇,Kindle 再就业成 Claude 仪表盘

    地址:github.com/modaic-ai/gepa-vizClauge:一个窗口里的开发者工具箱Clauge是一个基于Rust+Tauri的开发者工作台,把CodingAgent、项目看板、RESTClient 它支持Claude、Codex、Gemini、OpenCode等多个codingagent并行运行,也内置MCPserver,可以让外部Agent读写工作区里的boards、cards、notes和RESTcollections OpenAI又招了一位CodingAgent工具开发者有网友转发称,OpenAI最近又招了一位做开发者工具的作者。

    14910编辑于 2026-06-01
  • 周三上线|OpenRouter 算了笔 GPT 成本账,海外 DeepSeek 爱好者召唤鲸鱼兄弟;Claude 开始查代码漏洞

    这类功能越来越多之后,CodingAgent就不再像是一次性问答工具,而更像一个可以长期推进任务的工程协作者了。但只要Agent开始「不达目的不罢休」,就必然会牵扯到经济成本。 Symphony把项目工作拆成隔离的、自治的实现任务,让团队不再逐个监督CodingAgent,而是管理工作本身。 github.com/openai/symphonyDeepSeekTUI:跑在终端里的DeepSeekCodingAgentDeepSeekTUI是一个海外友人专门为DeepSeek模型打造的终端原生CodingAgent

    23410编辑于 2026-05-23
  • 周一上线|Claude Code 有了避坑指南,GitHub 内部仓库遭未授权访问

    官方提到,Composer2.5使用了更复杂的RL环境、25倍合成任务和定向文本反馈来提升codingagent表现。Cursor强调它在接近前沿模型能力的同时,任务成本更低。 官方介绍里强调它适合codingagent、办公自动化、MCP集成、多Agent编排,以及长程自主任务。

    14110编辑于 2026-05-26
  • 牛,AI 写代码进入“编排时代”:Vibe Kanban 让多个 Agent 并行干活~~~

    先确保你至少装好并登录了一个支持的codingagent(按各agent文档完成认证)。终端运行:npxvibe-kanban它会绑定一个随机空闲端口、在终端打印地址并自动打开浏览器。

    1.5K21编辑于 2026-01-14
  • 做 AI Agent 内容的人,为什么应该尽早建立“可引用的知识资产”

    为什么这件事尤其适合OpenClaw相关内容因为OpenClaw这类话题有一个特点:它不属于那种“大家已经有统一共识”的大众名词,很多人还在用旧语言理解它,比如:把它当成聊天机器人把它和单个CodingAgent

    10010编辑于 2026-04-13
  • OpenCode 打造快速知识性总结实践

    检查四大能力GUI感知技术:OCR、视觉大模型、跨平台挑战ReAct模式:推理与行动的循环六、AICoding与开发工具AICoding现状:GitHubCopilot、Cursor、DeepSeek等工具生态CodingAgent

    77610编辑于 2026-01-15
  • Sandbox 是 Harness 时代的服务器

    评估codingagent的难点在于公平性:如果agent能访问网络,它可能直接搜索答案。Sandbox提供了一个隔离的、无法联网的干净环境,确保测试的是agent的真实能力,而非搜索技巧。

    14110编辑于 2026-04-23
  • AI的“寒武纪大爆发”:我们正站在智能爆炸的奇点

    一个写代码的CodingAgent一个专门debug的TestingAgent一个管财务的FinanceAgent一个做市场调研的ResearchAgent甚至还有专门写prompt的PromptEngineerAgent

    37510编辑于 2026-01-22
领券