Keras 创始人、ARC Prize 发起人 François Chollet 在 YC 演讲中深入剖析:为什么预训练扩展无法通向 AGI,流体智能与静态技能的本质区别,以及结合离散程序搜索与深度学习的全新 AI 范式
「智能不是技能本身,而是产生技能的过程。不要混淆道路和修建道路的公司 —— 智能是面对全新情况时开辟新路的能力。」—— François Chollet
从 2019 年到今天,基础模型经历了约 50,000 倍的算力扩展,但在 ARC 基准测试上仅从 0% 提升到约 10%,而普通人可以轻松达到 95% 以上。这证明了流体智能不会从预训练规模的扩大中「自发涌现」,我们需要全新的范式。
智能是将过去经验转化为应对未来新情况的效率比。它不是你能做什么,而是你用多少数据、多少计算量来获取和部署技能。如果需要数十万小时才能习得简单技能,或需要穷举棋盘所有走法才能下好棋,那就称不上智能。
2024 年 AI 研究社区从预训练扩展转向测试时适应(Test-Time Adaptation)。模型不再只是检索预存知识,而是在推理阶段动态修改自身行为来适应新问题。OpenAI 的 o3 模型首次在 ARC 上展示了人类水平的表现,标志着流体智能的真正萌芽。
类型一(值中心)抽象擅长感知和直觉,Transformer 已经做得很好;类型二(程序中心)抽象擅长推理和规划,需要离散程序搜索。真正的智能是将两者结合 —— 用直觉引导搜索,让搜索变得可行,就像人类下棋时用直觉缩小候选走法,再用逻辑推演最佳选择。