人工智能行业最新动态
LlamaIndex 宣布已从 RAG 框架进化为专注 Agent 文档处理的平台,支持复杂推理循环、MCP 工具发现、Python 代码生成。LlamaParse 已服务 30 万+用户覆盖 50+ 行业。
Vercel CEO 披露一起 AI Agent 安全事件:Claude Opus 4.6 在执行部署时编造了一个 GitHub 仓库 ID,恰好对应真实公开仓库,导致陌生代码被部署到用户环境。所幸无害。
Google 发布 Pixel 设备 3 月更新:Gemini 可代用户完成叫车、订购杂货等日常任务,支持自定义图标生成、Circle to Search 看图购物、餐厅推荐等功能。
NVIDIA 回顾 DGX 十年历程:2016 年 GTC 上 Jensen Huang 发布 DGX-1(世界第一台 AI 超算),如今已演变为现代 AI 工厂的通用蓝图。GTC 2026 将展望下一个十年。
宝玉详细拆解 GPT-5.3 Instant 三大改进:不再过度拒绝和免责、联网搜索从堆链接变为筛选整合、高风险领域幻觉率降低近 27%。面向所有 ChatGPT 用户上线。
o1 早期参与者、主导 o1/o3 后训练并交付 GPT-5 全系列后训练的 Max Schwarzer 宣布加入 Anthropic,称想回归一线 RL 研究不再做管理。OpenAI 又一关键人才出走。
Cursor 宣布支持 MCP Apps,AI Agent 可以在对话中直接渲染交互式用户界面,进一步扩展编程助手的能力边界。
GPT-5.3 Instant 替代 GPT-5.2 Instant 成为 ChatGPT 默认日常模型,联网搜索时幻觉率降低 26.8%,回答更直接不再"说教",API 可通过 gpt-5.3-chat-latest 调用。
Replit 宣布平台已有 4000 万用户构建应用,并推出应用 Remix 功能,支持用户快速复制和修改他人应用。
知名博主宝玉评价 Claude Code 降低了 Agent 使用门槛,让未接触过编程 Agent 的用户也能体验 AI 自主执行任务,从写代码扩展到更多场景。
研究人员提出 OmniLottie 方法,可通过参数化 Lottie Token 自动生成矢量动画,实现文本到动画的端到端生成。
Browserbase 推出基于 Stagehand CLI 的浏览器技能,比 MCP 工具更快,每次运行使用独立浏览器上下文以防止提示注入攻击。
通义千问技术负责人林俊阳发布告别消息,团队成员透露离开并非其本人意愿。另一核心负责人惠碧远也已离开,恰逢 Qwen 3.5 小模型系列刚刚发布。
Runway 宣布在其平台内整合多领域最佳 AI 模型,涵盖图像、视频、音频和语言,并预告将有更多模型上线。
Qwen 团队发布 Qwen 3.5 全系列 GPTQ-Int4 量化版本,原生支持 vLLM 和 SGLang 推理框架,显存占用更低,适合 GPU 资源有限的部署场景。
OpenAI 表示新版 GPT-5.3 Instant 减少了不必要的拒答行为和冗余的安全提示语。
Gemini 3.1 Flash-Lite 在 Google AI Studio 和 Vertex AI 开放预览,输出速度较 2.5 Flash 提升 45%,支持动态思维级别以匹配任务复杂度。
OpenAI 回应用户反馈,表示 GPT-5.3 Instant 大幅减少了过度讨好、油腻的回复风格。
Gemini 3.1 Flash-Lite 正式发布,定位为 Gemini 3 系列中成本效率最高的模型,专为大规模智能应用打造。
OpenAI 宣布 GPT-5.3 Instant 模型全面上线 ChatGPT,官方称该版本更准确、回复风格更自然。
vLLM 宣布与 nCompass 合作,将性能分析、追踪对比和 AI 辅助分析整合到工作流中,帮助生态定位瓶颈并提升整体性能。
Latent Space 主理人 swyx 指出,多位开发者正在探索移除人工代码审查瓶颈,让 Agent 完全自主工作,预计 3-6 个月内将成为主流趋势。
n8n 发布新工作流模板,展示五种评估 AI 输出的方法,支持用 Google Sheets 对比多个模型表现并追踪结果变化趋势。
Latent Space 创始人 swyx 分享其多年整理的思想领袖方法论笔记,从讽刺出发变为真诚实践指南,并将与 mada299 合办第二场私人线上研讨会。
vLLM 项目邀请 SkyRL 团队在本周四 LLMs on Ray 线上活动中分享 vLLM 在强化学习推理工作流中的实践经验。
通义千问官方确认 Qwen 3.5 小模型系列已在 Ollama 平台上线,用户可通过命令行快速部署运行。
Altman 在 OpenAI 与国防部合作决策背景下分享四项核心原则,强调民主进程必须掌控 AI 发展方向,AI 应实现民主化并赋能个体而非取代人类决策权。
通义千问 Qwen3.5-9B 模型现已上线 LM Studio,本地运行仅需约 7GB 内存,大幅降低本地部署门槛。
OpenAI 将在与国防部协议中明确写入禁止用于美国国内监控条款,承诺遵守宪法第四修正案及相关国家安全法律,强调 AI 系统不得故意用于对美国公民的国内监视。