每一步都踩在行业的关键节点上——他的职业轨迹,本身就是一部 AI 行业进化史。
5月19日,AI 圈扔出一颗深水炸弹。
知名 AI 研究员、OpenAI 创始成员之一 Andrej Karpathy(安德烈·卡帕西)在社交媒体上宣布,自己已正式加入 Anthropic。
「个人更新:我加入了 Anthropic。我认为,未来几年大型语言模型前沿领域的进展将具有深远影响。我非常期待加入团队,重新投入研发工作。我仍然热爱教育,并计划在未来恢复相关工作。」
Karpathy 是当前 AI 圈最具影响力的研究者之一。
2011年至2015年,他在斯坦福大学攻读计算机科学博士,导师是著名计算机视觉学者李飞飞。博士期间,他主要研究深度学习与视觉理解,尤其是图像描述生成和视觉问答。
2014年,他在斯坦福创建了 CS231n 课程。这门课程后来成为全球最受欢迎的深度学习与计算机视觉课程之一,也让他在 AI 教育领域获得了广泛影响力。
2015年博士毕业后,Karpathy 加入 OpenAI,担任创始研究科学家。2017年,他离开 OpenAI 加入特斯拉,出任 AI 总监及 Autopilot 视觉负责人。在特斯拉任职期间,他主导了 Autopilot 神经网络架构的重建,并推动「纯视觉」自动驾驶方案的发展——也就是后来让马斯克坚持不用激光雷达的技术底气。
2022年7月,Karpathy 离开特斯拉。2023年,他重返 OpenAI,参与核心模型研发。2024年初,他再次离开,并宣布创立 AI 教育项目 Eureka Labs。
然后就是这次——他回来了,重新加入 Anthropic。
2014年创建的 CS231n 课程,至今仍是全球最火的深度学习与计算机视觉课程。从 Stanford 到 Coursera,从高校学生到工业界从业者,这门课培养了数以万计的 AI 从业者。它让深度学习从学术论文走进普通开发者的电脑前。
主导 Autopilot 神经网络架构重建,推动自动驾驶走向「纯视觉」路线——不用激光雷达,用摄像头 + 深度学习搞定一切。这个选择在当时争议很大,但后来被证明是正确的方向。
Karpathy 提出「氛围编码」(Vibe Coding)概念,本质上是:用自然语言编程,靠 AI 的「直觉」而不是精确代码。这让「用 AI 编程」变成一种被广泛讨论的编程哲学,影响了很多开发者的日常工作方式。
从公开信息看,Karpathy 选择 Anthropic 有几个原因:
1. 大模型研究是核心
Anthropic 正在全力推进 Claude 系列模型的能力边界,对于想重新投入大模型研发的人来说,这是最好的舞台。
2. Claude Code 的想象空间
Karpathy 本身是代码 AI 的深度用户和推动者。Claude Code 已经在代码生成和 Agent 方向展现出实力,他的加入可能进一步强化这个方向。
3. 对前沿的渴望
他自己在推文中说:「未来几年大型语言模型前沿领域的进展将具有深远影响。」这种判断让他选择了最有可能做出突破的地方。
对 Anthropic 来说,Karpathy 的加盟有几层意义:
层面 | 影响 |
|---|---|
技术 | 他在 CV、RL、GAN 方面的积累,加上对大模型的深度理解,能为 Claude 的多模态能力提供支撑 |
人才 | OpenAI 创始成员加盟,对外传递的信号很强——Anthropic 是真正做研究的地方 |
竞争 | Google I/O 大会前夕放出这个消息,时机本身也是一种宣战 |
Karpathy 的职业轨迹,本身就是一部 AI 行业进化史:
OpenAI(创始成员,RL/GAN/CV 早期研究)
Tesla(自动驾驶视觉负责人)
OpenAI(核心模型研发)
Eureka Labs(AI 教育)
Anthropic(大模型前沿)
每一步都踩在行业的关键节点上。
而这一次,他选择了重新回到大模型研发的一线。