AI 资讯

LlamaIndex：从 RAG 框架进化为 Agent 文档处理平台

LlamaIndex 宣布已从 RAG 框架进化为专注 Agent 文档处理的平台，支持复杂推理循环、MCP 工具发现、Python 代码生成。LlamaParse 已服务 30 万+用户覆盖 50+ 行业。

产品发布

@llama_index 阅读 →

AI Agent 安全事件：Claude Opus 4.6 编造 GitHub 仓库 ID 并部署到用户 Vercel 账户

Vercel CEO 披露一起 AI Agent 安全事件：Claude Opus 4.6 在执行部署时编造了一个 GitHub 仓库 ID，恰好对应真实公开仓库，导致陌生代码被部署到用户环境。所幸无害。

大模型

@dotey 阅读 →

Google：Pixel 3 月更新深度整合 Gemini，可代办叫车、杂货等日常任务

Google 发布 Pixel 设备 3 月更新：Gemini 可代用户完成叫车、订购杂货等日常任务，支持自定义图标生成、Circle to Search 看图购物、餐厅推荐等功能。

大模型

@Google 阅读 →

NVIDIA：DGX 十周年，从单台 AI 超算到 AI 工厂蓝图

NVIDIA 回顾 DGX 十年历程：2016 年 GTC 上 Jensen Huang 发布 DGX-1（世界第一台 AI 超算），如今已演变为现代 AI 工厂的通用蓝图。GTC 2026 将展望下一个十年。

芯片

@nvidia 阅读 →

GPT-5.3 Instant 详解：减少说教感、搜索质量提升、事实准确性改善

宝玉详细拆解 GPT-5.3 Instant 三大改进：不再过度拒绝和免责、联网搜索从堆链接变为筛选整合、高风险领域幻觉率降低近 27%。面向所有 ChatGPT 用户上线。

产品发布

@dotey 阅读 →

OpenAI 推理核心研究员 Max Schwarzer 离职加入 Anthropic

o1 早期参与者、主导 o1/o3 后训练并交付 GPT-5 全系列后训练的 Max Schwarzer 宣布加入 Anthropic，称想回归一线 RL 研究不再做管理。OpenAI 又一关键人才出走。

人物

@dotey 阅读 →

Cursor：支持 MCP Apps，Agent 可在对话中渲染交互式 UI

Cursor 宣布支持 MCP Apps，AI Agent 可以在对话中直接渲染交互式用户界面，进一步扩展编程助手的能力边界。

产品发布

@cursor_ai 阅读 →

OpenAI：GPT-5.3 Instant 上线，幻觉率降低 27%、搜索更精准

GPT-5.3 Instant 替代 GPT-5.2 Instant 成为 ChatGPT 默认日常模型，联网搜索时幻觉率降低 26.8%，回答更直接不再"说教"，API 可通过 gpt-5.3-chat-latest 调用。

大模型

@OpenAI 阅读 →

Replit：AI 编程平台用户突破 4000 万

Replit 宣布平台已有 4000 万用户构建应用，并推出应用 Remix 功能，支持用户快速复制和修改他人应用。

行业

@Replit 阅读 →

宝玉：Claude Code 让普通人也能指挥 AI Agent 完成复杂任务

知名博主宝玉评价 Claude Code 降低了 Agent 使用门槛，让未接触过编程 Agent 的用户也能体验 AI 自主执行任务，从写代码扩展到更多场景。

观点

@dotey 阅读 →

新研究 OmniLottie：通过参数化 Lottie Token 生成矢量动画

研究人员提出 OmniLottie 方法，可通过参数化 Lottie Token 自动生成矢量动画，实现文本到动画的端到端生成。

研究

@_akhaliq 阅读 →

Browserbase：发布全新 Browser Skill，为 AI Agent 提供安全远程浏览器

Browserbase 推出基于 Stagehand CLI 的浏览器技能，比 MCP 工具更快，每次运行使用独立浏览器上下文以防止提示注入攻击。

产品发布

@browserbase 阅读 →

Qwen 技术负责人林俊阳离职，核心团队变动引关注

通义千问技术负责人林俊阳发布告别消息，团队成员透露离开并非其本人意愿。另一核心负责人惠碧远也已离开，恰逢 Qwen 3.5 小模型系列刚刚发布。

人物

@dotey 阅读 →

Runway：平台集成全球顶尖图像、视频、音频和语言模型

Runway 宣布在其平台内整合多领域最佳 AI 模型，涵盖图像、视频、音频和语言，并预告将有更多模型上线。

产品发布

@runwayml 阅读 →

通义千问：Qwen 3.5 系列 GPTQ-Int4 量化权重发布

Qwen 团队发布 Qwen 3.5 全系列 GPTQ-Int4 量化版本，原生支持 vLLM 和 SGLang 推理框架，显存占用更低，适合 GPU 资源有限的部署场景。

产品发布

@Alibaba_Qwen 阅读 →

OpenAI：GPT-5.3 Instant 减少不必要拒绝和说教式免责声明

OpenAI 表示新版 GPT-5.3 Instant 减少了不必要的拒答行为和冗余的安全提示语。

大模型

@OpenAI 阅读 →

Google：Gemini 3.1 Flash-Lite 输出速度提升 45%，支持动态思维级别

Gemini 3.1 Flash-Lite 在 Google AI Studio 和 Vertex AI 开放预览，输出速度较 2.5 Flash 提升 45%，支持动态思维级别以匹配任务复杂度。

大模型

@Google 阅读 →

OpenAI：GPT-5.3 Instant 大幅减少「AI 味」回复

OpenAI 回应用户反馈，表示 GPT-5.3 Instant 大幅减少了过度讨好、油腻的回复风格。

大模型

@OpenAI 阅读 →

Google DeepMind：发布 Gemini 3.1 Flash-Lite，最高性价比 Gemini 3 系列模型

Gemini 3.1 Flash-Lite 正式发布，定位为 Gemini 3 系列中成本效率最高的模型，专为大规模智能应用打造。

大模型

@GoogleDeepMind 阅读 →

OpenAI：GPT-5.3 Instant 正式向所有用户推出

OpenAI 宣布 GPT-5.3 Instant 模型全面上线 ChatGPT，官方称该版本更准确、回复风格更自然。

大模型

@OpenAI 阅读 →

vLLM：与 nCompass 合作打造 GPU 性能分析工具链

vLLM 宣布与 nCompass 合作，将性能分析、追踪对比和 AI 辅助分析整合到工作流中，帮助生态定位瓶颈并提升整体性能。

行业

@vllm_project 阅读 →

swyx：AI Agent 正在终结代码审查流程，SDLC 将被颠覆

Latent Space 主理人 swyx 指出，多位开发者正在探索移除人工代码审查瓶颈，让 Agent 完全自主工作，预计 3-6 个月内将成为主流趋势。

观点

@swyx 阅读 →

n8n：发布 AI 输出评估模板，可对比 Gemini、Claude、GPT 等模型表现

n8n 发布新工作流模板，展示五种评估 AI 输出的方法，支持用 Google Sheets 对比多个模型表现并追踪结果变化趋势。

产品发布

@n8n_io 阅读 →

swyx：公开「如何成为思想领袖」方法论笔记

Latent Space 创始人 swyx 分享其多年整理的思想领袖方法论笔记，从讽刺出发变为真诚实践指南，并将与 mada299 合办第二场私人线上研讨会。

观点

@swyx 阅读 →

vLLM：本周四举办 RL 推理工作坊，SkyRL 分享 vLLM 在强化学习中的应用

vLLM 项目邀请 SkyRL 团队在本周四 LLMs on Ray 线上活动中分享 vLLM 在强化学习推理工作流中的实践经验。

大模型

@vllm_project 阅读 →

通义千问：确认 Qwen 3.5 小模型系列已上线 Ollama 平台

通义千问官方确认 Qwen 3.5 小模型系列已在 Ollama 平台上线，用户可通过命令行快速部署运行。

产品发布

@Alibaba_Qwen 阅读 →

Sam Altman：阐述 AI 治理四大原则——对齐、民主化、赋能与个体自主

Altman 在 OpenAI 与国防部合作决策背景下分享四项核心原则，强调民主进程必须掌控 AI 发展方向，AI 应实现民主化并赋能个体而非取代人类决策权。

观点

@sama 阅读 →

通义千问：Qwen3.5-9B 登陆 LM Studio，仅需约 7GB 即可本地运行

通义千问 Qwen3.5-9B 模型现已上线 LM Studio，本地运行仅需约 7GB 内存，大幅降低本地部署门槛。

产品发布

@Alibaba_Qwen 阅读 →

Sam Altman：公布与美国防部合作的 AI 安全原则，承诺不用于国内监控

OpenAI 将在与国防部协议中明确写入禁止用于美国国内监控条款，承诺遵守宪法第四修正案及相关国家安全法律，强调 AI 系统不得故意用于对美国公民的国内监视。

观点

@sama 阅读 →

LlamaIndex：从 RAG 框架进化为 Agent 文档处理平台

AI Agent 安全事件：Claude Opus 4.6 编造 GitHub 仓库 ID 并部署到用户 Vercel 账户

Google：Pixel 3 月更新深度整合 Gemini，可代办叫车、杂货等日常任务

NVIDIA：DGX 十周年，从单台 AI 超算到 AI 工厂蓝图

GPT-5.3 Instant 详解：减少说教感、搜索质量提升、事实准确性改善

OpenAI 推理核心研究员 Max Schwarzer 离职加入 Anthropic

Cursor：支持 MCP Apps，Agent 可在对话中渲染交互式 UI

OpenAI：GPT-5.3 Instant 上线，幻觉率降低 27%、搜索更精准

Replit：AI 编程平台用户突破 4000 万

宝玉：Claude Code 让普通人也能指挥 AI Agent 完成复杂任务

新研究 OmniLottie：通过参数化 Lottie Token 生成矢量动画

Browserbase：发布全新 Browser Skill，为 AI Agent 提供安全远程浏览器

Qwen 技术负责人林俊阳离职，核心团队变动引关注

Runway：平台集成全球顶尖图像、视频、音频和语言模型

通义千问：Qwen 3.5 系列 GPTQ-Int4 量化权重发布

OpenAI：GPT-5.3 Instant 减少不必要拒绝和说教式免责声明

Google：Gemini 3.1 Flash-Lite 输出速度提升 45%，支持动态思维级别

OpenAI：GPT-5.3 Instant 大幅减少「AI 味」回复

Google DeepMind：发布 Gemini 3.1 Flash-Lite，最高性价比 Gemini 3 系列模型

OpenAI：GPT-5.3 Instant 正式向所有用户推出

vLLM：与 nCompass 合作打造 GPU 性能分析工具链

swyx：AI Agent 正在终结代码审查流程，SDLC 将被颠覆

n8n：发布 AI 输出评估模板，可对比 Gemini、Claude、GPT 等模型表现

swyx：公开「如何成为思想领袖」方法论笔记

vLLM：本周四举办 RL 推理工作坊，SkyRL 分享 vLLM 在强化学习中的应用

通义千问：确认 Qwen 3.5 小模型系列已上线 Ollama 平台

Sam Altman：阐述 AI 治理四大原则——对齐、民主化、赋能与个体自主

通义千问：Qwen3.5-9B 登陆 LM Studio，仅需约 7GB 即可本地运行

Sam Altman：公布与美国防部合作的 AI 安全原则，承诺不用于国内监控

Claude：记忆功能现已上线，可在设置中开启