← Back to Videos
YC 访谈 2025.01.31

Bob McGrew:AI Agent 与通往 AGI 之路

OpenAI 前首席研究官 Bob McGrew 与 Garry Tan 深度对话:从 OpenAI 早期的机器人和 Dota 2 项目,到 Scaling Laws 的发现、推理模型如何解锁 Agent 能力,以及通往 AGI 的清晰路径

Guest
Bob McGrew
Interviewer
Garry Tan
Duration
30:44
Category
YC 访谈

「推理模型真正要解锁的,是 Agent 代替你执行操作的可能性。这一直是可能的,但从来没有足够好。你需要极高的可靠性,而现在这已经在视线之内了。」—— Bob McGrew

👤 嘉宾介绍

B
Bob McGrew
OpenAI 前首席研究官
此前在 Palantir 积累大量管理经验,2016 年加入 OpenAI,领导了机器人手、Dota 2、GPT 系列等核心研究项目,亲历了从 GPT-1 到 GPT-4 的整个发展历程
G
Garry Tan
Y Combinator CEO
YC 现任 CEO 兼总裁,与 Bob McGrew 曾是 Palantir 同事,设计师与工程师出身,曾联合创立 Posterous 和 Initialized Capital

📑 内容章节

00:00开场:AGI 的定义已经被实现,但为什么世界没有改变?
00:45Bob McGrew 的背景:从 Palantir 到 OpenAI
02:04OpenAI 早期项目:机器人手解魔方与 Dota 2
04:52OpenAI 的文化密码:介于 DeepMind 和 Google Brain 之间
09:16Scaling Laws 与数据墙:预训练的瓶颈与推理的突破
14:45推理模型如何解锁 AI Agent 的可能性
20:05AI 采用为何如此缓慢?Forward Deployed Engineer 的启示
24:40AI 时代的教育与未来职业:天才与管理者

💡 核心观点

1

Scale 是 OpenAI 的核心信仰

从 Dota 2 到机器人手再到 GPT 系列,OpenAI 的关键洞察始终是:将海量经验/数据喂入神经网络,它就能学习和泛化。Alec Radford 坚持了多年才让 GPT-1 生效,而 Dota 2 和机器人的规模化理念直接催生了 GPT-2、GPT-3、GPT-4。

2

推理是通往 AGI 的缺失拼图

过去五年,前沿实验室一直认为 AGI 需要两步:第一步是预训练,第二步是推理能力。现在推理已经被攻克(o1、o3),我们进入了纯粹的规模化阶段,通往 AGI 的路径已经清晰。每增加一个数量级的计算,可靠性就能从 90% 到 99% 再到 99.9%。

3

AI Agent 的核心障碍是可靠性

Agent 一直理论上可行,但从未足够好。要让用户愿意等待 5 分钟甚至 5 小时让 Agent 完成任务,它必须在最后真正有效。推理模型让模型能够维持一条连贯的思维链,在长时间内稳步推进问题,这正是 Agent 所需的能力。

4

AI 需要的不是更多智能,而是更好的软件

Bob 提出一个深刻的谜题:2018 年人们对 AGI 的定义已经被满足,但世界并未剧变。AI 采用缓慢的原因不是能力不够,而是缺少将智能与用户真实需求连接起来的软件。正如 Palantir 的 Forward Deployed Engineer 所做的那样,需要有人深入用户场景,重新构想工作流。