全部 今日 本周 本月
2026-03-03

新论文:CUDA Agent — 用大规模智能体强化学习生成高性能 CUDA 内核

新研究提出 CUDA Agent,利用大规模智能体强化学习自动生成高性能 CUDA 内核代码,推动 GPU 编程自动化。

研究
@_akhaliq 阅读 →

Replicate:Minimax Music 2.5 上线,支持段落级精准音乐控制

Minimax Music 2.5 登陆 Replicate,支持段落级精准控制和详细段落标签(前奏/副歌/桥段等),覆盖 100+ 乐器,可生成逼真人声。

产品发布
@replicate 阅读 →

Boston Dynamics:人形机器人应该多像人?Atlas 设计理念分享

Boston Dynamics 硬件与工业设计团队将讨论应用需求、安全理念和模块化策略如何塑造 Atlas 机器人设计,现已开放注册。

机器人
@BostonDynamics 阅读 →

swyx:Gartner 对 AI 的预测如今看来如何?

swyx 分享 Gartner 早期对 AI 的预测图表并发出质疑,引发对行业分析机构预测准确性的讨论。

观点
@swyx 阅读 →

swyx:OpenAI 有重大新动作,引发社区热议

AI 领域知名博主 swyx 对 OpenAI 的最新举动表示震惊,附图引发社区广泛关注和讨论。

行业
@swyx 阅读 →

研究:自适应测试时缩放用于图像编辑,从规模到速度的转变

新论文提出自适应测试时缩放(Adaptive Test-Time Scaling)方法应用于图像编辑,探索如何在推理阶段动态调整计算资源以平衡编辑质量与速度。

研究
@_akhaliq 阅读 →

LlamaIndex:从 RAG 框架进化为 Agent 文档处理平台

LlamaIndex 宣布已从 RAG 框架进化为专注 Agent 文档处理的平台,支持复杂推理循环、MCP 工具发现、Python 代码生成。LlamaParse 已服务 30 万+用户覆盖 50+ 行业。

产品发布
@llama_index 阅读 →

AI Agent 安全事件:Claude Opus 4.6 编造 GitHub 仓库 ID 并部署到用户 Vercel 账户

Vercel CEO 披露一起 AI Agent 安全事件:Claude Opus 4.6 在执行部署时编造了一个 GitHub 仓库 ID,恰好对应真实公开仓库,导致陌生代码被部署到用户环境。所幸无害。

大模型
@dotey 阅读 →

Google:Pixel 3 月更新深度整合 Gemini,可代办叫车、杂货等日常任务

Google 发布 Pixel 设备 3 月更新:Gemini 可代用户完成叫车、订购杂货等日常任务,支持自定义图标生成、Circle to Search 看图购物、餐厅推荐等功能。

大模型
@Google 阅读 →

NVIDIA:DGX 十周年,从单台 AI 超算到 AI 工厂蓝图

NVIDIA 回顾 DGX 十年历程:2016 年 GTC 上 Jensen Huang 发布 DGX-1(世界第一台 AI 超算),如今已演变为现代 AI 工厂的通用蓝图。GTC 2026 将展望下一个十年。

芯片
@nvidia 阅读 →

GPT-5.3 Instant 详解:减少说教感、搜索质量提升、事实准确性改善

宝玉详细拆解 GPT-5.3 Instant 三大改进:不再过度拒绝和免责、联网搜索从堆链接变为筛选整合、高风险领域幻觉率降低近 27%。面向所有 ChatGPT 用户上线。

产品发布
@dotey 阅读 →

OpenAI 推理核心研究员 Max Schwarzer 离职加入 Anthropic

o1 早期参与者、主导 o1/o3 后训练并交付 GPT-5 全系列后训练的 Max Schwarzer 宣布加入 Anthropic,称想回归一线 RL 研究不再做管理。OpenAI 又一关键人才出走。

人物
@dotey 阅读 →

Cursor:支持 MCP Apps,Agent 可在对话中渲染交互式 UI

Cursor 宣布支持 MCP Apps,AI Agent 可以在对话中直接渲染交互式用户界面,进一步扩展编程助手的能力边界。

产品发布
@cursor_ai 阅读 →

OpenAI:GPT-5.3 Instant 上线,幻觉率降低 27%、搜索更精准

GPT-5.3 Instant 替代 GPT-5.2 Instant 成为 ChatGPT 默认日常模型,联网搜索时幻觉率降低 26.8%,回答更直接不再"说教",API 可通过 gpt-5.3-chat-latest 调用。

大模型
@OpenAI 阅读 →

Replit:AI 编程平台用户突破 4000 万

Replit 宣布平台已有 4000 万用户构建应用,并推出应用 Remix 功能,支持用户快速复制和修改他人应用。

行业
@Replit 阅读 →

宝玉:Claude Code 让普通人也能指挥 AI Agent 完成复杂任务

知名博主宝玉评价 Claude Code 降低了 Agent 使用门槛,让未接触过编程 Agent 的用户也能体验 AI 自主执行任务,从写代码扩展到更多场景。

观点
@dotey 阅读 →

新研究 OmniLottie:通过参数化 Lottie Token 生成矢量动画

研究人员提出 OmniLottie 方法,可通过参数化 Lottie Token 自动生成矢量动画,实现文本到动画的端到端生成。

研究
@_akhaliq 阅读 →

Browserbase:发布全新 Browser Skill,为 AI Agent 提供安全远程浏览器

Browserbase 推出基于 Stagehand CLI 的浏览器技能,比 MCP 工具更快,每次运行使用独立浏览器上下文以防止提示注入攻击。

产品发布
@browserbase 阅读 →

Qwen 技术负责人林俊阳离职,核心团队变动引关注

通义千问技术负责人林俊阳发布告别消息,团队成员透露离开并非其本人意愿。另一核心负责人惠碧远也已离开,恰逢 Qwen 3.5 小模型系列刚刚发布。

人物
@dotey 阅读 →

Runway:平台集成全球顶尖图像、视频、音频和语言模型

Runway 宣布在其平台内整合多领域最佳 AI 模型,涵盖图像、视频、音频和语言,并预告将有更多模型上线。

产品发布
@runwayml 阅读 →

通义千问:Qwen 3.5 系列 GPTQ-Int4 量化权重发布

Qwen 团队发布 Qwen 3.5 全系列 GPTQ-Int4 量化版本,原生支持 vLLM 和 SGLang 推理框架,显存占用更低,适合 GPU 资源有限的部署场景。

产品发布
@Alibaba_Qwen 阅读 →

OpenAI:GPT-5.3 Instant 减少不必要拒绝和说教式免责声明

OpenAI 表示新版 GPT-5.3 Instant 减少了不必要的拒答行为和冗余的安全提示语。

大模型
@OpenAI 阅读 →

Google:Gemini 3.1 Flash-Lite 输出速度提升 45%,支持动态思维级别

Gemini 3.1 Flash-Lite 在 Google AI Studio 和 Vertex AI 开放预览,输出速度较 2.5 Flash 提升 45%,支持动态思维级别以匹配任务复杂度。

大模型
@Google 阅读 →

OpenAI:GPT-5.3 Instant 大幅减少「AI 味」回复

OpenAI 回应用户反馈,表示 GPT-5.3 Instant 大幅减少了过度讨好、油腻的回复风格。

大模型
@OpenAI 阅读 →

Google DeepMind:发布 Gemini 3.1 Flash-Lite,最高性价比 Gemini 3 系列模型

Gemini 3.1 Flash-Lite 正式发布,定位为 Gemini 3 系列中成本效率最高的模型,专为大规模智能应用打造。

大模型
@GoogleDeepMind 阅读 →

OpenAI:GPT-5.3 Instant 正式向所有用户推出

OpenAI 宣布 GPT-5.3 Instant 模型全面上线 ChatGPT,官方称该版本更准确、回复风格更自然。

大模型
@OpenAI 阅读 →

vLLM:与 nCompass 合作打造 GPU 性能分析工具链

vLLM 宣布与 nCompass 合作,将性能分析、追踪对比和 AI 辅助分析整合到工作流中,帮助生态定位瓶颈并提升整体性能。

行业
@vllm_project 阅读 →

swyx:AI Agent 正在终结代码审查流程,SDLC 将被颠覆

Latent Space 主理人 swyx 指出,多位开发者正在探索移除人工代码审查瓶颈,让 Agent 完全自主工作,预计 3-6 个月内将成为主流趋势。

观点
@swyx 阅读 →

n8n:发布 AI 输出评估模板,可对比 Gemini、Claude、GPT 等模型表现

n8n 发布新工作流模板,展示五种评估 AI 输出的方法,支持用 Google Sheets 对比多个模型表现并追踪结果变化趋势。

产品发布
@n8n_io 阅读 →

swyx:公开「如何成为思想领袖」方法论笔记

Latent Space 创始人 swyx 分享其多年整理的思想领袖方法论笔记,从讽刺出发变为真诚实践指南,并将与 mada299 合办第二场私人线上研讨会。

观点
@swyx 阅读 →