首页
学习
活动
专区
圈层
工具
发布

#路由

AI写代码终于不瞎烧钱了:边车路由让顶级性能成本直降35%

用户11563501

传统模型路由是个看起来很美的东西:基准测试能打,真用来写生产代码就掉链子,省的那点钱还不够改bug的。强如OpenAI和Anthropic都在模型路由上栽跟头,...

900

从 PilotDeck 源码看 AI Agent 路由架构的设计方法论

heidsoft

外部扩展可以实现自己的路由逻辑,通过 CustomRouterRegistry 注册进来。RouterRuntime 在决策时优先调用自定义路由。

1600

OpenClaw 3.2 重磅更新:PDF 原生支持上线,4 项破坏性变更你必须知道!

用户1640761

旧行为: 新安装默认包含编程、系统等全套工具。 新行为:tools.profile 默认值改为 messaging,不再自动加载代码执行和系统操作类工具。

2900

Perplexity Computer vs Claude Cowork:19 模型云端超级大脑 vs Claude 桌面深度执行官,谁才是你的终极数字搭档?

用户1640761

2 月 26 日,Perplexity 官宣 Perplexity Computer;近期,Anthropic 也重磅更新了 Claude Cowork 插件。...

4500

11-Reward不是一个分数函数这么简单

anzhsoft

上一篇写 KL、clip、entropy,说明 actor 更新需要限速器。但限速器限制的是 reward 和 advantage 驱动出来的更新方向。继续往前...

2500

一周七条重磅,2026年下半场AI竞争的三条主线已经画好了

袁锐钦

这是一个多智能体编排系统。你调一个API,它自动把任务路由到GPT-5.5、Gemini 3.5、Claude Opus等模型池里最合适的那个。你自己不用管理多...

20210

智谱开源 slime 框架研究报告

勇哥AI笔记

国内几家大模型在不同的方向上投入资源,而且开源出来造福全行业。每个模型团队在训练时可以采集各家之长,每一家的技术突破都会迅速变成全行业的“公共养料”。

15910

模型之外的事——这一周,三个信号不约而同

用户10097875

这一周,技术圈很安静。没有新模型刷屏,没有跑分屠榜,朋友圈也没出现那种“不学就被淘汰”的标题。

7810

多智能体架构下的多轮对话上下文管理:从设计到实现

tunsuy

单体 Agent 的多轮对话很简单——所有消息都在一个 messages[] 列表里,LLM 天然能理解上下文。但当架构变成这样时:

13410

RAG模式到底有8种?还是9种?还是25种?

jeffery_jcm

首先一句话通俗解释什么是RAG? 全称: Retrieval-Augmented Generation (检索增强生成) :RAG是一种结合信息检索与大语言模型...

9500

vLLM的语义路由框架:把"改策略"从工程问题变成配置问题

唐国梁Tommy

这篇来自 vLLM 开源社区的工作不是在刷榜,而是在解决一个实际的系统工程问题:当企业同时运行十几个来自不同提供商的语言模型,一条请求进来,谁来决定路由给哪个模...

10510

KAIST最新研究:一文读懂UniversalRAG如何实现多模态、多粒度的高效检索

唐国梁Tommy

今天,我们要深入探讨一个最新框架——UniversalRAG。这篇来自KAIST与DeepAuto.ai的最新研究,不仅仅是对现有RAG技术的简单升级,更是一次...

9100

22M 小模型搞定 Tool 路由一份蒸馏训练方案从架构到部署

javpower

最开始我让 GPT-4o / Qwen 直接判断 "该调哪些 tool",效果不差,但生产上有三个硬伤:

11110

用 SDD 方法开发一个 AI Gateway

用户5602664

企业用大模型,四个问题绕不开:谁在调模型?敏感数据有没有出内网?花了多少钱?出事怎么查?AI Gateway 做的就是在客户端和上游模型之间插一层治理层,把这四...

10010

ECCV 2026 | GeoSR:让VLM真正用上几何信息,静态/动态空间推理均达SOTA!

Amusi

过去几年,VLM 在图像理解、视频问答、多模态对话上进展很快。它们可以识别物体、描述场景、总结事件,甚至完成不少复杂问答。但空间推理并不是简单的语义识别。

14610

Kali Linux部署Codex 开发学习两不误

逍遥子大表哥

接下来,我们在Kali中安装Codex,因为Nodex等环境在Kali中已经默认安装,因此只需执行一条命令即可。

9610

Agent Skills 体系是怎么跑起来的?

臻成AI大模型

解耦之后的架构,大致分成这几层:用户发起请求,Agent 做决策,然后经过路由层找到对应技能,技能中心负责加载和调度,最终由具体的能力体调用底层工具完成执行。

9210

10 个 AI 工程师必须掌握的 LangChain & LangGraph 概念

deephub

但是应用需要检索文档、调用工具、处理故障、路由请求、记住历史操作,还要在关键决策节点引入人工审核。这时这个聊天机器人已经变成了一套工作流。

14300

1300人收藏的元 skill 创建技能,X 上的大佬都在推荐它!

开源星探

一个真正可以在团队里长期使用的 Skill,需要解决路由识别、质量评估、版本治理、跨平台兼容等一系列工程问题。

16410
领券