人工智能行业最新动态
新研究提出 CUDA Agent,利用大规模智能体强化学习自动生成高性能 CUDA 内核代码,推动 GPU 编程自动化。
Minimax Music 2.5 登陆 Replicate,支持段落级精准控制和详细段落标签(前奏/副歌/桥段等),覆盖 100+ 乐器,可生成逼真人声。
Boston Dynamics 硬件与工业设计团队将讨论应用需求、安全理念和模块化策略如何塑造 Atlas 机器人设计,现已开放注册。
swyx 分享 Gartner 早期对 AI 的预测图表并发出质疑,引发对行业分析机构预测准确性的讨论。
AI 领域知名博主 swyx 对 OpenAI 的最新举动表示震惊,附图引发社区广泛关注和讨论。
新论文提出自适应测试时缩放(Adaptive Test-Time Scaling)方法应用于图像编辑,探索如何在推理阶段动态调整计算资源以平衡编辑质量与速度。
LlamaIndex 宣布已从 RAG 框架进化为专注 Agent 文档处理的平台,支持复杂推理循环、MCP 工具发现、Python 代码生成。LlamaParse 已服务 30 万+用户覆盖 50+ 行业。
Vercel CEO 披露一起 AI Agent 安全事件:Claude Opus 4.6 在执行部署时编造了一个 GitHub 仓库 ID,恰好对应真实公开仓库,导致陌生代码被部署到用户环境。所幸无害。
Google 发布 Pixel 设备 3 月更新:Gemini 可代用户完成叫车、订购杂货等日常任务,支持自定义图标生成、Circle to Search 看图购物、餐厅推荐等功能。
NVIDIA 回顾 DGX 十年历程:2016 年 GTC 上 Jensen Huang 发布 DGX-1(世界第一台 AI 超算),如今已演变为现代 AI 工厂的通用蓝图。GTC 2026 将展望下一个十年。
宝玉详细拆解 GPT-5.3 Instant 三大改进:不再过度拒绝和免责、联网搜索从堆链接变为筛选整合、高风险领域幻觉率降低近 27%。面向所有 ChatGPT 用户上线。
o1 早期参与者、主导 o1/o3 后训练并交付 GPT-5 全系列后训练的 Max Schwarzer 宣布加入 Anthropic,称想回归一线 RL 研究不再做管理。OpenAI 又一关键人才出走。
Cursor 宣布支持 MCP Apps,AI Agent 可以在对话中直接渲染交互式用户界面,进一步扩展编程助手的能力边界。
GPT-5.3 Instant 替代 GPT-5.2 Instant 成为 ChatGPT 默认日常模型,联网搜索时幻觉率降低 26.8%,回答更直接不再"说教",API 可通过 gpt-5.3-chat-latest 调用。
Replit 宣布平台已有 4000 万用户构建应用,并推出应用 Remix 功能,支持用户快速复制和修改他人应用。
知名博主宝玉评价 Claude Code 降低了 Agent 使用门槛,让未接触过编程 Agent 的用户也能体验 AI 自主执行任务,从写代码扩展到更多场景。
研究人员提出 OmniLottie 方法,可通过参数化 Lottie Token 自动生成矢量动画,实现文本到动画的端到端生成。
Browserbase 推出基于 Stagehand CLI 的浏览器技能,比 MCP 工具更快,每次运行使用独立浏览器上下文以防止提示注入攻击。
通义千问技术负责人林俊阳发布告别消息,团队成员透露离开并非其本人意愿。另一核心负责人惠碧远也已离开,恰逢 Qwen 3.5 小模型系列刚刚发布。
Runway 宣布在其平台内整合多领域最佳 AI 模型,涵盖图像、视频、音频和语言,并预告将有更多模型上线。
Qwen 团队发布 Qwen 3.5 全系列 GPTQ-Int4 量化版本,原生支持 vLLM 和 SGLang 推理框架,显存占用更低,适合 GPU 资源有限的部署场景。
OpenAI 表示新版 GPT-5.3 Instant 减少了不必要的拒答行为和冗余的安全提示语。
Gemini 3.1 Flash-Lite 在 Google AI Studio 和 Vertex AI 开放预览,输出速度较 2.5 Flash 提升 45%,支持动态思维级别以匹配任务复杂度。
OpenAI 回应用户反馈,表示 GPT-5.3 Instant 大幅减少了过度讨好、油腻的回复风格。
Gemini 3.1 Flash-Lite 正式发布,定位为 Gemini 3 系列中成本效率最高的模型,专为大规模智能应用打造。
OpenAI 宣布 GPT-5.3 Instant 模型全面上线 ChatGPT,官方称该版本更准确、回复风格更自然。
vLLM 宣布与 nCompass 合作,将性能分析、追踪对比和 AI 辅助分析整合到工作流中,帮助生态定位瓶颈并提升整体性能。
Latent Space 主理人 swyx 指出,多位开发者正在探索移除人工代码审查瓶颈,让 Agent 完全自主工作,预计 3-6 个月内将成为主流趋势。
n8n 发布新工作流模板,展示五种评估 AI 输出的方法,支持用 Google Sheets 对比多个模型表现并追踪结果变化趋势。
Latent Space 创始人 swyx 分享其多年整理的思想领袖方法论笔记,从讽刺出发变为真诚实践指南,并将与 mada299 合办第二场私人线上研讨会。