斯坦福教授、「AI 教母」李飞飞在 YC 活动中深度分享:从 ImageNet 的诞生到空间智能的宏大愿景,从创办 World Labs 的初心到对 AGI 定义的思考,以及她对创业者和研究者的真挚建议
「在我看来,AGI 如果没有空间智能就不完整。我要解决的就是这个问题。我的整个职业生涯都在追逐那些难到近乎疯狂的问题。」—— Fei-Fei Li
2007 年,Fei-Fei 和学生决定下载 10 亿张互联网图片,创建世界上最大的视觉分类数据集。当时 AI 几乎无人问津,但她坚信数据驱动方法将带来范式转移。2012 年 AlexNet 在 ImageNet 挑战赛上的突破,是数据、GPU 和神经网络三者首次汇聚的历史时刻。
视觉的进化用了 5.4 亿年,而语言仅用了不到 50 万年。理解 3D 世界、在 3D 世界中导航与交互,是比语言更古老、更根本的智能形式。LLM 本质上是一维序列建模,而空间智能需要处理 3D 到 2D 的投影、物理规律以及生成与重建之间的连续体。
Fei-Fei 与 Justin Johnson (实时神经风格迁移)、Ben Mildenhall (NeRF 论文作者)、Christoph Lassner (Pulsar/可微渲染先驱) 三位世界级技术专家共同创立 World Labs,致力于构建超越平面像素和语言的世界模型,应用场景从 3D 创作、游戏到机器人和元宇宙。
从培养 Andrej Karpathy、Jim Fan 等传奇学生,到创业招聘,Fei-Fei 始终寻找一种统一的品质:智识上的无畏 (intellectual fearlessness)。不论背景和问题领域,拥抱困难、全力以赴的勇气才是成功者的根本特征。