全部 今日 本周 本月
2026-03-05

LlamaIndex:LlamaParse 挑战主流 LLM 文档解析能力

LlamaIndex 指出直接用 GPT-4o 解析 PDF 存在阅读顺序错乱、表格缺失、数据幻觉等问题,将于 3 月 26 日举办 LlamaParse 对比各大模型的在线研讨会。

产品发布
@llama_index 阅读 →

宝玉:编程 Agent 之外,GPT-4.5 和 o1 pro 仍是巅峰

知名博主宝玉认为,除编程 Agent 领域外,OpenAI 的 GPT-4.5 和 o1 pro 目前仍处于行业顶尖水平。

观点
@dotey 阅读 →

swyx:SWE-bench 基准测试可信度遭质疑

Latent Space 主理人 swyx 指出,SWE-bench 作者本人不认可低成本采样的基准结果,要达到统计显著性需 30-60 倍计算量,呼吁社区冷静对待排行榜分数。

研究
@swyx 阅读 →

HeyGen:Video Agent 登陆 Replicate 平台

HeyGen 的 Video Agent 上线 Replicate,可通过文本提示自动生成含 AI 脚本、虚拟主播、配音和剪辑的完整视频,同时推出 Avatar IV 引擎和翻译口型同步功能。

产品发布
@replicate 阅读 →

Replicate:LTX-2.3 视频生成模型上线

LTX-2.3 视频模型发布,支持更清晰的画面保真度与屏幕文字渲染、复杂多主体提示词、首尾帧图生视频、原生竖屏及 24/48fps 输出。

产品发布
@replicate 阅读 →

Together AI:AI Native Conf 上连发七项研究成果

Together Research 在 AI Native 大会上一周内发布七项新成果,涵盖 FlashAttention、ATLAS、ThunderKittens 等,均将投入生产环境。

研究
@togethercompute 阅读 →

swyx:开源 Claude Code 上下文压缩分析工具

swyx 因不满 Claude Code 的上下文压缩质量,开源了一款分析工具,帮助开发者深入了解压缩过程中丢失了哪些信息,也可扩展用于 Codex 压缩分析。

观点
@swyx 阅读 →

swyx:寻找开源 Claude Cowork 替代品,否则将自己构建

Latent Space 主理人 swyx 发帖征集开源的 Claude Cowork(协作编程)替代方案,表示已离不开这一功能,如找不到将自行开发。

观点
@swyx 阅读 →

Vercel 与 Stripe 合作推出安全支付集成,现已正式可用

Vercel 与 Stripe 合作的安全支付功能正式 GA,开发者可通过 v0、Vercel Marketplace 或 CLI 一键集成 Stripe 支付。

产品发布
@vercel 阅读 →

Replicate:Kling Video 3.0 运动控制上线,精准还原人脸身份与复杂表情

Kling Video 3.0 Motion Control 在 Replicate 上线,支持精准人脸身份锁定、复杂表情还原、遮挡下的高保真恢复,以及各种角度下的清晰细节。

产品发布
@replicate 阅读 →

LTX-2.3 视频生成模型已在 Hugging Face 开源

LTX-2.3 视频生成模型已发布到 Hugging Face,用户可直接下载使用。

大模型
@_akhaliq 阅读 →

Karpathy:nanochat 单节点 8×H100 仅需 2 小时训练 GPT-2

nanochat 项目在单个 8×H100 节点上将 GPT-2 训练时间从约 3 小时缩短至 2 小时,最大提升来自将数据集从 FineWeb-edu 切换到 NVIDIA ClimbMix。

研究
@karpathy 阅读 →

Karpathy:将记忆操作作为工具引入 RL 训练,当前记忆实现只是早期尝试

Karpathy 认为在当前范式下,可以通过将各种记忆操作作为工具引入强化学习来取得重大进展。目前的压缩和记忆实现只是早期粗糙版本,都可以泛化并纳入优化流程。

观点
@karpathy 阅读 →

宝玉:GPT-5.4 深度解析——首个原生支持电脑操控的通用模型

GPT-5.4 成为 OpenAI 首个原生支持电脑操控的通用模型,在 OSWorld 桌面操控测试中以 75% 成功率超越人类(72.4%),编程能力整合了 GPT-5.3-Codex,投行建模得分从 68.4% 跃升至 87.3%。

产品发布
@dotey 阅读 →

OpenAI:发布思维链可控性评估套件,GPT-5.4 难以隐藏推理过程

OpenAI 发布新的思维链(CoT)可控性评估套件和研究论文,发现 GPT-5.4 Thinking 难以隐藏其推理过程,表明 CoT 监控仍是有效的安全工具。

研究
@OpenAI 阅读 →

OpenAI:GPT-5.4 Thinking 和 Pro 今日起逐步上线

GPT-5.4 Thinking 和 Pro 版本今日起在 ChatGPT、API 和 Codex 中逐步推出,这是 OpenAI 最新的旗舰推理模型。

产品发布
@OpenAI 阅读 →

n8n:社区成员用 n8n 复刻 OpenClaw,打造自托管 AI Agent 框架

n8n 大使 Friedemann 基于 n8n、Supabase 和 AI 工作流复刻了 OpenClaw,推出 n8n-claw 自托管 AI Agent 框架,可完全自主部署。

行业
@n8n_io 阅读 →

Perplexity:GPT-5.4 和 GPT-5.4 Thinking 已上线

Perplexity 宣布 GPT-5.4 和 GPT-5.4 Thinking 现已面向 Pro 和 Max 订阅用户开放使用。

产品发布
@perplexity_ai 阅读 →

Sam Altman:GPT-5.4 新增 /fast 快速模式

Sam Altman 补充提到 GPT-5.4 还新增了 /fast 快速模式,认为用户会喜欢这一功能。

观点
@sama 阅读 →

Cursor:GPT-5.4 已接入,内部基准测试排名第一

Cursor 宣布 GPT-5.4 已上线其编辑器,称该模型比此前版本更自然、更主动,目前在 Cursor 内部基准测试中排名第一。

产品发布
@cursor_ai 阅读 →

Cursor:推出 Automations 功能,打造常驻运行的 AI Agent

Cursor 发布 Automations 新功能,支持构建始终在线的 AI Agent,可持续执行自动化任务,进一步强化其 AI 编程助手定位。

产品发布
@cursor_ai 阅读 →

Elon Musk:Grok iPhone 应用评分超百万次,均分 4.9 星

Grok iPhone 应用在 App Store 获得超 100 万条评分且均分达 4.9 星,Elon Musk 发推庆祝并附下载链接。

大模型
@elonmusk 阅读 →

Elon Musk:Grok Imagine 视频生成能力亮相

Elon Musk 展示 Grok Imagine 的视频生成功能,称其生成的视频质量优秀。该推文获超 2.3 万点赞,引发广泛关注。

大模型
@elonmusk 阅读 →

OpenAI:GPT-5.4 支持中途打断和实时引导,响应更高效

GPT-5.4 号称最准确高效模型,token 更少、速度更快。用户可在思考过程中随时打断并调整方向,本周 Android 和网页端上线,iOS 即将跟进。

产品发布
@OpenAI 阅读 →

Sam Altman:GPT-5.4 支持 100 万 token 上下文和原生计算机操控

Sam Altman 介绍 GPT-5.4 在知识工作和网页搜索方面大幅提升,具备原生计算机操控能力,支持百万 token 上下文,并可在生成过程中实时调整方向。

产品发布
@sama 阅读 →

OpenAI:GPT-5.4 正式发布,推理、编程、智能体能力全面整合

GPT-5.4 Thinking 和 GPT-5.4 Pro 现已在 ChatGPT、API 和 Codex 中推出,将推理、编程和智能体工作流整合为统一的前沿模型。

产品发布
@OpenAI 阅读 →

Runway:全球各地线下 Meetup 活动开放报名

Runway 宣布在全球多个城市举办线下 Meetup 活动,用户可报名参加或申请在当地举办。

行业
@runwayml 阅读 →

马斯克:未来将有大量机器人

马斯克在回复网友时表示,未来将会有大量机器人出现,再次强调其对人形机器人产业的看好。

机器人
@elonmusk 阅读 →

Latent Space:AI Engineer 大会将在新加坡举办,演讲者申请已开放

swyx 宣布 AI Engineer 大会将落地新加坡,演讲者申请通道已开放,邀请顶尖 AI 工程师齐聚亚洲。

行业
@swyx 阅读 →

Elon Musk:点击 Grok 图标即可对任何帖子进行事实核查和提问

Musk 宣布 X 平台新功能,用户只需点击左上角的 Grok 图标,即可对任意帖子进行事实核查和提问,进一步将 AI 助手融入社交媒体体验。

大模型
@elonmusk 阅读 →