在开发「语义显微镜 V3.0」和「brainproto 类脑原型」两个项目的过程中,验证了一个结论:
我们耗时多轮迭代,持续优化 LLM 自动修 Bug 流水线,从数据喂入、评分机制、Bug 分类到任务调度,完成了全链路架构优化。所有前置工程问题悉数解决,流水线...
vibe-trading 是一个让 LLM 用自然语言驱动量化研究 + 受控实盘的 Agent 平台——它把 18 个数据源、450+ 公式 alpha、9 家...
当我几周前发布了 Neuron AI 官方路由包后,我收到了来自许多开发者的相同问题,只是措辞不同:它能将困难的请求发送给强大模型,而将简单的请求发送给便宜模型...
如果你正在频繁调用大模型API,你一定对“Token消耗”这件事又爱又恨——爱的是它让智能触手可及,恨的是它像水流一样悄无声息地溜走。
AI可见性营销(AI Visibility Marketing)还处在一个很早期的阶段。与SEO相比,它最大的不同在于,我们几乎无法看到模型内部究竟如何做出判断...
今天这篇论文「Agentic Auto-Scheduling: An Experimental Study of LLM-Guided Loop Optimiz...
Langfuse 的在线评测核心是 LLM-as-Judge——也就是用一个大模型当裁判,来看你 Agent 的输出并打分。裁判自己也是个 LLM,所以你得先把...
这是一个基于 Andrej Karpathy 的 LLM Wiki 模式 构建的开源项目。
用vLLM部署推理模型,长序列推理时频繁爆显存。于是给服务加了KV缓存压缩策略,淘汰90%的非重要缓存token,重启后显存占用几乎没变,还是会在相近的序列长度...
从 Prompt 到 Loop,四个工程阶段每一步都在用更多 token 换更高可用性。这不是模型在变聪明,是工程在替模型还债。
众所周知,大模型是通用模型,大小公司要么是卖模型的、要么是买模型的,大家发现在专业场景下,大模型处理还是乏力。
这一章我们聊聊这两年注意力架构的技术演化路线。全文覆盖三个方向,每个方向都是上一个方向的"接力棒":
技术栈:Obsidian · AI Agent 框架 · SQLite FTS5 · Python
GSK(中国) | 全栈架构师 (已认证)
让这颗大脑真正有用的东西,叫 Harness:套在 LLM 外面的运行时脚手架,给它装上感官、双手和记忆。事件接入、Agent 编排、持久化状态、自愈循环、可观...
在人工智能发展史上,2026年被视为大语言模型(LLM)从“技术奇点”转向“产业奇点”的关键节点。这一转变的核心驱动力已不再仅仅是模型参数规模的线性扩张,而是围...