← Back to Videos
YC Decoded 2025.04.08

AI Agent 的下一个突破已经到来

从 Manus 的多智能体架构到应用层「Wrapper」之争:YC Decoded 深度解析新一代 AI Agent 的工作原理、真实能力与创业者如何在 AI 应用层构建可持续的护城河

Speaker
YC Decoded
Duration
8:29
Date
2025.04.08
Category
YC Decoded

AI 领域的成功并不取决于是否重新发明轮子,而在于谁能把现有模型拼装成用户真正喜爱的产品。Manus 以多智能体协作架构在 GAIA 基准测试中逼近人类水平,揭示了 AI Agent 应用层的巨大潜力。

📌 关于本期

本期 YC Decoded 聚焦近期引爆全球关注的 AI Agent 平台 Manus。视频从技术架构到实际表现,全面拆解这款被称为「中国下一个 DeepSeek 时刻」的多智能体 AI 系统,并深入探讨 AI 应用层创业公司面临的「Wrapper」争议 -- 在基础模型之上构建产品,究竟是取巧还是真正的创新?

📑 内容章节

00:00Manus 横空出世:被称为中国下一个 DeepSeek 时刻
01:01多智能体架构揭秘:Planner、Sub-Agent 与 Executor
02:49核心技术:动态任务分解与 Chain-of-Thought 注入
03:34实际能力与 GAIA 基准测试:86.5% 逼近人类水平
04:37Wrapper 之争:应用层创业的价值与护城河

💡 核心观点

1

多智能体协作超越单一模型

Manus 不依赖单一大型神经网络,而是像一位高管带领专家团队:Planner Agent 制定总计划,Sub-Agent 各司其职(知识、记忆、执行),Executor Agent 汇总输出。这种架构让它能调用 29 种工具,从网页自动化到安全代码执行一应俱全。

2

GAIA 基准测试刷新纪录

在涵盖推理、多模态处理、网页浏览和工具使用的 GAIA 基准测试中,Manus 以 86.5% 的得分大幅超越 OpenAI Deep Research 的 74%,距离人类平均水平 92% 仅差几个百分点,展现了多智能体系统的巨大潜力。

3

Wrapper 不是贬义词

Cursor、Windsurf、Harvey 等成功产品都可以被称为「Wrapper」。真正区分优劣的是:直觉化的 UI 设计、专有的评测体系、精细的模型微调,以及深思熟虑的多智能体架构。Manus 联合创始人直言:他们从第一天起就选择与模型开发正交发展。

4

可持续差异化是终极挑战

Wrapper 类产品能快速迭代部署、提供专业 UX、降低前期成本,但也面临 API 定价变动和平台策略调整的风险。创始人需要投资难以复制的专有评测、将工作流深度嵌入用户习惯、或锁定竞争对手难以获取的数据集和平台集成。