← Back to Videos
Y Combinator 2026.01.22

每个创始人都该了解的机器学习技术:Diffusion 深度解析

YC 访问合伙人 Francois Cholard 深入讲解 Diffusion 扩散模型 —— 从基础原理到 Flow Matching,从图像生成到蛋白质折叠、机器人策略和天气预报,用代码演示为什么这是当今最强大的机器学习范式

Speaker
YC
Duration
27:10
Date
2026.01.22
Category
YC 访谈

「Flow Matching 用大约 10-15 行代码就实现了当今最强大的机器学习过程 —— 它与领域无关,可以应用于图像、蛋白质、天气、机器人策略等任何高维数据。」—— Francois Cholard

👤 嘉宾介绍

F
Francois Cholard
YC 访问合伙人 / Stanford 博士研究员
2012 年起从事计算机视觉研究,师从 Fei-Fei Li。曾创立 Focal Systems 并运营十年,现回到 Stanford 攻读博士,研究方向为基于 Diffusion 的世界模型与 AGI
D
Decoded 主持人
YC Decoded 系列节目主持
YC 技术深度解析系列节目主持人,擅长将前沿 AI 研究拆解为创业者可理解的核心概念

📑 内容章节

00:00开场介绍:什么是 Diffusion,为什么每个创始人都该了解
02:48Diffusion 的广泛应用:图像、蛋白质、自动驾驶、天气预报
04:06技术演进史:从 2015 年原始论文到 Flow Matching
07:02代码实战:用 PyTorch 实现 Diffusion 的核心步骤
11:40Flow Matching 详解:10 行代码实现最强 ML 过程
19:23Squint Test:Diffusion 与通用智能的关系
22:27Diffusion 的前沿应用:LLM、机器人、天气、代码生成
24:49给创始人的建议:如何利用 Diffusion 构建产品

💡 核心观点

1

Diffusion 是学习任意数据分布的通用框架

Diffusion 的核心思想极其简单:给数据加噪声,然后训练模型学会逆转这个过程。它特别擅长在高维空间中用少量数据学习复杂分布 —— 仅用 30 张图片就能在百万维空间中学到有效表示。这种能力使它远超传统方法。

2

Flow Matching:10 行代码改变一切

Flow Matching 来自 Meta 的 Yaron Lipman,它将 Diffusion 简化到极致:不再走曲折的去噪路径,而是学习从噪声到数据的全局速度方向 —— 一条直线。训练循环仅需 5 行代码,与领域完全解耦,可用于图像、蛋白质、天气等任何数据。

3

Diffusion 已吞噬 AI 的几乎所有领域

除了自回归 LLM 和 AlphaGo 式的博弈之外,Diffusion 已成为几乎所有 AI 领域的最优方法:图像与视频生成(Midjourney、Sora、Flux)、蛋白质折叠(AlphaFold,诺贝尔奖)、机器人策略(Diffusion Policy)、天气预报(GenCast)、甚至代码生成(Diffusion LLM)。

4

Squint Test:Diffusion 比 LLM 更接近大脑

如果把 LLM 和大脑放在一起「眯眼看」,差异巨大:LLM 一次只产生一个 token,永远不回头;而大脑大量使用递归、概念性思考和随机性。Diffusion 恰好提供了这两个关键特性 —— 利用随机性学习,以及一次生成整个概念块而非逐 token 输出。