Andrej Karpathy：我们在召唤幽灵，而非构建动物

从 AGI 时间线到教育的未来：Karpathy 横跨深度学习、强化学习、自动驾驶和教育的完整思想图谱。

0:00 AGI Is Still a Decade Away / AGI 仍需十年

30:33 LLM Cognitive Deficits / LLM 的认知缺陷

40:53 RL Is Terrible / 强化学习很糟糕

50:26 How Do Humans Learn? / 人类如何学习？

1:07:13 AGI Will Blend Into 2% GDP Growth / AGI 将融入 2% GDP 增长

1:18:24 ASI / 超级智能

1:33:38 Evolution of Intelligence & Culture / 智能与文化的进化

1:43:43 Why Self Driving Took So Long / 自动驾驶为何耗时如此之久

1:57:08 Future of Education / 教育的未来

★ Core Takeaways / 核心要点

从 Karpathy 近 15 年的 AI 研究与工程经验中提炼出的六大核心观点。

LLM 通过模仿互联网上的人类文本而诞生，形成了一种"灵体"般的智能实体。我们并非在运行进化过程来构建动物，而是在通过模仿人类数据来召唤幽灵。预训练是一种"劣质版进化"(crappy evolution) -- 是我们现有技术条件下能做到的最佳起点。

RL 的核心问题是"通过吸管吸取监督信号" -- 模型做了一分钟的推理，最终只得到一个"对/错"的信号，然后把这个信号广播到整个轨迹。每一步都被等权地上调或下调，哪怕中间走了很多弯路。人类绝不会这样学习。我们需要 3-5 个新的算法范式突破。

Karpathy 认为 AGI 不会在 GDP 曲线中留下任何痕迹 -- 就像 iPhone、互联网、计算机一样，一切都会融入持续了 250 年的 2% 指数增长。"递归自我改进"早已发生了几十年，AI 不过是延续这一趋势。他预测不会有离散跳跃。

未来的关键在于将 LLM 的"认知核心"从海量记忆中剥离。一个十亿参数的模型或许就足以承载智能的核心算法，而所有事实性知识都可以通过外部查找获取。当前模型的记忆力太强反而是缺陷 -- 它们应该像人类一样学会"忘记"和"泛化"。

从自动驾驶的五年经验中，Karpathy 总结出"九的行军"规律：从 demo 到产品，每增加一个 9（90% -> 99% -> 99.9%）都需要同等的工作量。AI 编程面临同样的问题 -- 安全关键代码的容错要求不亚于自动驾驶，这解释了为什么他的时间线比多数人更长。

Karpathy 选择投身教育而非加入 AI 实验室，因为他认为"实验室的工作有一定确定性"，而人类在 AI 时代的命运更需要关注。他正在打造 Eureka -- 一个以"每秒顿悟次数"为目标的教育平台。在 AGI 之后，教育将像健身一样，成为一种自我提升的"运动"。

Andrej Karpathy:
"We're Summoning Ghosts, Not Building Animals"