行业观察

空间智能综述:AI 理解三维世界的技术版图与产业竞赛

从李飞飞的「下一个十年」到世界模型军备竞赛——3D 表示、空间推理、世界模型与具身三条技术主线,一张产业地图,与尚未解决的数据与物理之战

Pro 限定研报

2026-06-06 35 篇信源 读完约 18 分钟

一句话先说清:空间智能要解决什么

过去三年,大语言模型证明了 AI 能把人类的语言学得出神入化。但语言是一套扁平的符号系统——它能描述世界,却不内含世界。真实世界有几何、有深度、有物理、有因果,而这恰恰是当前最强模型最薄弱的地方。李飞飞(Fei-Fei Li)把补上这块短板的能力称为 空间智能(Spatial Intelligence),并在 2024 年 4 月的 TED 演讲与 2025 年 11 月的长文《From Words to Worlds》中,把它定义为"认知赖以建立的脚手架"——感知几何、深度、运动以及物体之间关系的能力,是把"看见"升级为"推理"、把"感知"变为"行动"、把"想象"变为"创造"的那一步[1][2]