

题图摄于旧金山downtown
这两年,“AI PC”这个词已经快被说疲了。每家厂商都在讲本地 AI、会议总结、背景虚化、Copilot,但很多时候我用完的感觉是:电脑确实多了几个 AI 小功能,可电脑本身并没有变。你还是在打开软件、切换窗口、复制粘贴,只是旁边多了一个会帮你转写、降噪和抠图的小助手。
所以我看到 NVIDIA 把 RTX Spark 放进 Windows PC 时,第一反应不是“又一颗芯片来了”,而是:这一次,AI PC 这个词可能终于有点像真的了。说句实话,如果续航和兼容性不出大问题,我会认真考虑把它换成下一台主力机。但前提是,它得先过实机考验,这个我后面会说。
这不是替 NVIDIA 打广告。第一代产品肯定会贵,也肯定会有坑,Windows on Arm 的兼容性不可能一夜之间变成苹果那种整体体验。但 RTX Spark 至少把一个问题摆到了台面上:未来的电脑,到底只是加几个 AI 小按钮,还是要真的围绕 AI 工作流重新设计?
参数当然要看,但我这次最先注意到的不是“1 Petaflop”,而是最高 128GB 统一内存。对普通读者,我先翻译一下:Tensor Core 可以理解成 NVIDIA 专门为 AI 计算准备的加速单元,统一内存则是 CPU 和 GPU 共享同一块大内存,不用在两边反复搬数据。
这件事对本地 AI 很关键。很多时候模型跑不起来,不是因为电脑完全没有算力,而是因为内存装不下、上下文撑不住、显存和内存之间来回倒腾太慢。你想让一个本地 Agent 读几十个文件、记住项目结构、调用工具、再生成结果,最先被卡住的往往不是“智商”,而是“地基”。
RTX Spark 不是传统意义上“CPU 旁边挂一块 GPU”,而是把 AI 推理、图形渲染、通用计算和内存系统做成一个更紧的整体。
不同精度、不同架构之间的 TOPS 数字不能直接硬比,这一点要先说清楚。高通、AMD、Intel 新一代 NPU 主要服务的是低功耗、常驻式、轻量 AI 功能;RTX Spark 在 FP4 精度下给到的是 1 Petaflop,也就是 1000 TOPS 级别的 AI 算力。口径不同,但量级差异摆在那里。说得粗一点,过去很多 AI PC 像是在自行车上装了一个小电机;RTX Spark 更像是直接问你,要不要换一台能上高速的车。
表面看,这是 NVIDIA 正式进入 PC 处理器市场,要和 Intel、AMD、高通、苹果站到同一个牌桌上。这个说法没错,但只看到这里,还是把问题看小了。NVIDIA 真正押的是另一个判断:AI Agent 可能成为下一代个人计算入口。
过去我们用电脑,是人主动操作软件。你打开 Word、浏览器、Photoshop,点菜单,找按钮,保存文件。电脑是工具,人是操作者。AI Agent 的逻辑不一样。你不是告诉电脑“点哪个按钮”,而是告诉它“帮我完成一件事”。比如:把项目跑一遍测试,修复 flake8 报错,生成变更说明;或者把一段访谈整理成文章,再找出三段适合剪短视频的素材。
这些任务背后不是一次简单问答,而是一串连续动作:读取本地文件,理解长上下文,保持任务状态,调用不同工具,生成结果并自查,必要时还能回退。我这段时间折腾过几类本地 Agent,最真实的感受就是:不是模型参数不够,而是那台电脑根本就不是为这种事设计的。上下文一长,内存开始吃紧;文件一多,检索和权限就麻烦;任务一复杂,工具调用和日志审计又成了新问题。
这就是 RTX Spark 的机会。云端大模型当然还会越来越强,但个人文件、企业资料、代码仓库和财务数据,不可能全部无脑上传云端。未来真正好用的 AI PC,大概率不是本地和云端二选一,而是本地负责私密、高频、低延迟任务,云端负责更复杂、更重的推理。
如果只看 Arm CPU,NVIDIA 并不是第一个。苹果 M 系列已经证明 Arm 可以做高端电脑,高通也一直在 Windows on Arm 上投入。但 NVIDIA 最狠的地方不是“它也有 Arm CPU”,而是 CUDA。
CUDA 简单说就是 NVIDIA 过去十几年围绕 GPU 建起来的一整套开发和计算生态。PyTorch、TensorFlow、TensorRT-LLM、各种推理框架、视频插件、科学计算工具、渲染软件,很多专业工作流已经默认 NVIDIA GPU 是最顺手的那条路。
我身边不少开发者用 MacBook Pro 跑本地模型时,并不是不能跑,而是经常要绕一层替代方案:Metal 插件、兼容分支和等待适配。遇到最新模型或新工具,很多时候 CUDA 路线先跑通,其他平台再慢慢跟上。
这种体验差异,参数表里看不出来,但真正做项目的人很敏感。硬件是入场券,生态才是护城河。
这次首批合作名单里有华硕、戴尔、惠普、联想、微软 Surface、微星等主流厂商,而且基本瞄准专业线、创作线或旗舰线。它不是先打低价普及市场,而是先去抢最愿意为本地 AI 性能付费的人。
PC 厂商为什么会跟?因为高端 Windows 本太需要新故事了。薄一点、轻一点、屏幕好一点、续航长一点,这些当然重要,但已经很难让用户觉得“我必须换”。如果 AI PC 只是 NPU 做会议总结和背景虚化,用户感知也不够强。RTX Spark 给 OEM 厂商提供了一个更激进的卖点:这不是普通轻薄本加 AI 标签,而是一台面向本地大模型、AI Agent、创作和开发的个人工作站。
它不会一夜之间打败苹果、Intel、AMD 或高通。苹果的续航、系统体验和生态粘性仍然很强;Intel 和 AMD 有深厚的 PC 基础;高通有低功耗优势。但 RTX Spark 会逼大家重新回答一个问题:高端 PC 以后到底比什么?不只是 CPU 跑分,而是本地模型能力、统一内存和智能体执行。
说到这里,我得把话收回来一点。RTX Spark 方向很有野心,但第一代产品不等于普通用户该马上冲。官方目前并没有给出所有机型的完整价格。考虑到 Blackwell GPU、Grace CPU、最高 128GB 统一内存和高端机型定位,第一批产品大概率会走高端价位。
如果你是 AI 大模型开发者、算法工程师、视频剪辑和 3D 创作者,或者团队里有大量敏感资料不能上传云端,同时每个月云 GPU 成本已经让你肉疼,那 RTX Spark 值得从现在开始关注。你关注的重点不是“概念新不新”,而是散热、续航、兼容性和真实工作流表现。
但如果你主要就是 Office、浏览网页、看视频,或者预算比较紧,或者已经深度绑定苹果生态、没有 CUDA 需求,那完全可以等等。第一代产品最适合观察,不一定最适合冲动下单。等第二代、第三代把价格和生态磨下来,可能才是更舒服的入场点。
第一是续航和散热。发布会上的性能数字不能代替真实体验。插电状态很猛,不等于电池状态也能长期稳定;峰值性能很漂亮,不等于风扇不吵、键盘不烫。
第二是 Windows on Arm 兼容性。普通用户最在意的不是“90 个软件能用”,而是“我每天必须用的那个老插件能不能用”。一个关键插件、一个企业内网工具、一个外设驱动出问题,整台机器的好感都会被打掉。
第三是 Agent 安全。硬件再强,也不等于智能体就可靠。它能不能误删文件?会不会把不该读的资料读了?执行过程有没有日志?出错能不能回滚?权限边界怎么设?这些问题比参数更麻烦,也更接近真正的生产力场景。
第四是生态适配。CUDA 很强,但 Windows on Arm、RTX Spark、AI Agent 要真正变成一条顺路,还需要大量应用厂商、插件作者、企业软件一起适配。生态不是发布会宣布出来的,是用户每天踩坑踩出来的。
我不想把结尾写成“PC 革命已经到来”那种大词。科技行业最不缺宏大叙事,最后真正决定产品命运的,往往是很具体的东西:价格、续航、发热、兼容性、以及软件是否好用。
但我也不会低估 RTX Spark。它至少说明,AI PC 的讨论正在从“有没有 AI 功能”走向“能不能承载 AI 工作流”。RTX Spark 试图从底层回答:如果本地大模型和 AI Agent 真的会进入日常工作,个人电脑应该怎么设计?
我的态度很简单:普通用户不用急着冲第一代;AI 开发者、内容创作者、工程团队和需要离线处理敏感资料的人,可以认真关注。等它真正上市,我更想做的是实机跑一套本地模型,跑一套代码 Agent,剪一段视频,接几个常用外设,再看看它到底是AI的未来,还是一台很昂贵的初代产品。到时候再下判断,会比现在喊口号更有用。
关注【亨利笔记】,持续跟踪 AI 技术进展、行业动态与前沿观点,稳稳抓住人工智能时代的真正机会。