← Back to Videos
YC Decoded 2025.03.11

GPT-4.5 = 大模型能量 | YC Decoded

YC Decoded 深度解析 OpenAI 最新发布的 GPT-4.5:这个迄今最大的模型在情商和创造力上迈出了重要一步,但它真正的意义在于为 GPT-5 的推理与预训练融合铺平道路

Speaker
YC Decoded
Duration
8:26
Date
2025.03.11
Category
YC Decoded

GPT-4.5 本身不是一个推理模型,而是 OpenAI 在无监督预训练规模化上的最新成果 -- 它真正的价值在于为预训练知识与推理能力的融合铺路,预示着 GPT-5 的统一架构时代即将到来。

📝 关于本期

本期 YC Decoded 聚焦 OpenAI 新发布的 GPT-4.5 模型。视频梳理了从 GPT-4 到 o1 再到 GPT-4.5 的发展脉络,包括内部代号 Strawberry 和 Orion 的来龙去脉,深入解析了 GPT-4.5 在情商、创造力和减少幻觉方面的突破,同时坦诚讨论了成本和推理能力方面的局限,并展望了预训练与推理两大范式在 GPT-5 中融合的宏大前景。

📑 内容章节

00:00GPT-4.5 发布概览:OpenAI 迄今最大的模型
00:54从 GPT-4 到 Orion:漫长的等待与内部代号揭秘
02:06情商为王:GPT-4.5 的核心差异化优势
04:00Vibes 测试与主观评估的挑战
05:20成本与局限:30 倍的价格差距
06:00大局观:两大范式融合与 GPT-5 展望

💡 核心观点

1

情商是 GPT-4.5 的杀手锏

与专注逻辑推理的 o1/o3 不同,GPT-4.5 在情感智能方面实现了质的飞跃。它能真正理解用户的意图,进行更深层次的对话,甚至展现出幽默感和对反讽的理解 -- 这些都是此前模型难以企及的「软实力」。

2

幻觉率大幅下降

GPT-4.5 在 SimpleQA 基准测试上准确率达到 61.9%(GPT-4o 仅 38.4%),幻觉率从 GPT-4o 的 61.2% 降至 37%。这意味着在日常查询中,GPT-4.5 的可信度有了实质性提升。

3

代价高昂但意义深远

GPT-4.5 的输入 token 成本是 GPT-4o 的 30 倍,输出成本是 15 倍,短期内难以大规模部署。但作为 OpenAI 迄今最大的模型(可能超过 GPT-4 十倍以上),它验证了无监督学习的规模化仍然有效。

4

GPT-5 = 预训练 + 推理的统一体

Sam Altman 已暗示,GPT-4.5 的广博知识与直觉,将与 o3 的推理能力融合为统一架构。GPT-4.5 是通往这个未来的关键桥梁 -- AI 系统将同时具备广泛理解力和强大推理能力。