上一组最后一篇按 fit()走完了一轮 PPO/GRPO step。进入第二组,我们换一个视角:同一轮 step 里有 actor、rollout、refere...
在开发「语义显微镜 V3.0」和「brainproto 类脑原型」两个项目的过程中,验证了一个结论:
我们耗时多轮迭代,持续优化 LLM 自动修 Bug 流水线,从数据喂入、评分机制、Bug 分类到任务调度,完成了全链路架构优化。所有前置工程问题悉数解决,流水线...
vibe-trading 是一个让 LLM 用自然语言驱动量化研究 + 受控实盘的 Agent 平台——它把 18 个数据源、450+ 公式 alpha、9 家...
当我几周前发布了 Neuron AI 官方路由包后,我收到了来自许多开发者的相同问题,只是措辞不同:它能将困难的请求发送给强大模型,而将简单的请求发送给便宜模型...
如果你正在频繁调用大模型API,你一定对“Token消耗”这件事又爱又恨——爱的是它让智能触手可及,恨的是它像水流一样悄无声息地溜走。
AI可见性营销(AI Visibility Marketing)还处在一个很早期的阶段。与SEO相比,它最大的不同在于,我们几乎无法看到模型内部究竟如何做出判断...
今天这篇论文「Agentic Auto-Scheduling: An Experimental Study of LLM-Guided Loop Optimiz...
Langfuse 的在线评测核心是 LLM-as-Judge——也就是用一个大模型当裁判,来看你 Agent 的输出并打分。裁判自己也是个 LLM,所以你得先把...
这是一个基于 Andrej Karpathy 的 LLM Wiki 模式 构建的开源项目。
用vLLM部署推理模型,长序列推理时频繁爆显存。于是给服务加了KV缓存压缩策略,淘汰90%的非重要缓存token,重启后显存占用几乎没变,还是会在相近的序列长度...
从 Prompt 到 Loop,四个工程阶段每一步都在用更多 token 换更高可用性。这不是模型在变聪明,是工程在替模型还债。
众所周知,大模型是通用模型,大小公司要么是卖模型的、要么是买模型的,大家发现在专业场景下,大模型处理还是乏力。
这一章我们聊聊这两年注意力架构的技术演化路线。全文覆盖三个方向,每个方向都是上一个方向的"接力棒":
技术栈:Obsidian · AI Agent 框架 · SQLite FTS5 · Python