全部 今日 本周 本月
2026-03-03

LlamaIndex:从 RAG 框架进化为 Agent 文档处理平台

LlamaIndex 宣布已从 RAG 框架进化为专注 Agent 文档处理的平台,支持复杂推理循环、MCP 工具发现、Python 代码生成。LlamaParse 已服务 30 万+用户覆盖 50+ 行业。

产品发布
@llama_index 阅读 →

AI Agent 安全事件:Claude Opus 4.6 编造 GitHub 仓库 ID 并部署到用户 Vercel 账户

Vercel CEO 披露一起 AI Agent 安全事件:Claude Opus 4.6 在执行部署时编造了一个 GitHub 仓库 ID,恰好对应真实公开仓库,导致陌生代码被部署到用户环境。所幸无害。

大模型
@dotey 阅读 →

Google:Pixel 3 月更新深度整合 Gemini,可代办叫车、杂货等日常任务

Google 发布 Pixel 设备 3 月更新:Gemini 可代用户完成叫车、订购杂货等日常任务,支持自定义图标生成、Circle to Search 看图购物、餐厅推荐等功能。

大模型
@Google 阅读 →

NVIDIA:DGX 十周年,从单台 AI 超算到 AI 工厂蓝图

NVIDIA 回顾 DGX 十年历程:2016 年 GTC 上 Jensen Huang 发布 DGX-1(世界第一台 AI 超算),如今已演变为现代 AI 工厂的通用蓝图。GTC 2026 将展望下一个十年。

芯片
@nvidia 阅读 →

GPT-5.3 Instant 详解:减少说教感、搜索质量提升、事实准确性改善

宝玉详细拆解 GPT-5.3 Instant 三大改进:不再过度拒绝和免责、联网搜索从堆链接变为筛选整合、高风险领域幻觉率降低近 27%。面向所有 ChatGPT 用户上线。

产品发布
@dotey 阅读 →

OpenAI 推理核心研究员 Max Schwarzer 离职加入 Anthropic

o1 早期参与者、主导 o1/o3 后训练并交付 GPT-5 全系列后训练的 Max Schwarzer 宣布加入 Anthropic,称想回归一线 RL 研究不再做管理。OpenAI 又一关键人才出走。

人物
@dotey 阅读 →

Cursor:支持 MCP Apps,Agent 可在对话中渲染交互式 UI

Cursor 宣布支持 MCP Apps,AI Agent 可以在对话中直接渲染交互式用户界面,进一步扩展编程助手的能力边界。

产品发布
@cursor_ai 阅读 →

OpenAI:GPT-5.3 Instant 上线,幻觉率降低 27%、搜索更精准

GPT-5.3 Instant 替代 GPT-5.2 Instant 成为 ChatGPT 默认日常模型,联网搜索时幻觉率降低 26.8%,回答更直接不再"说教",API 可通过 gpt-5.3-chat-latest 调用。

大模型
@OpenAI 阅读 →

Replit:AI 编程平台用户突破 4000 万

Replit 宣布平台已有 4000 万用户构建应用,并推出应用 Remix 功能,支持用户快速复制和修改他人应用。

行业
@Replit 阅读 →

宝玉:Claude Code 让普通人也能指挥 AI Agent 完成复杂任务

知名博主宝玉评价 Claude Code 降低了 Agent 使用门槛,让未接触过编程 Agent 的用户也能体验 AI 自主执行任务,从写代码扩展到更多场景。

观点
@dotey 阅读 →

新研究 OmniLottie:通过参数化 Lottie Token 生成矢量动画

研究人员提出 OmniLottie 方法,可通过参数化 Lottie Token 自动生成矢量动画,实现文本到动画的端到端生成。

研究
@_akhaliq 阅读 →

Browserbase:发布全新 Browser Skill,为 AI Agent 提供安全远程浏览器

Browserbase 推出基于 Stagehand CLI 的浏览器技能,比 MCP 工具更快,每次运行使用独立浏览器上下文以防止提示注入攻击。

产品发布
@browserbase 阅读 →

Qwen 技术负责人林俊阳离职,核心团队变动引关注

通义千问技术负责人林俊阳发布告别消息,团队成员透露离开并非其本人意愿。另一核心负责人惠碧远也已离开,恰逢 Qwen 3.5 小模型系列刚刚发布。

人物
@dotey 阅读 →

Runway:平台集成全球顶尖图像、视频、音频和语言模型

Runway 宣布在其平台内整合多领域最佳 AI 模型,涵盖图像、视频、音频和语言,并预告将有更多模型上线。

产品发布
@runwayml 阅读 →

通义千问:Qwen 3.5 系列 GPTQ-Int4 量化权重发布

Qwen 团队发布 Qwen 3.5 全系列 GPTQ-Int4 量化版本,原生支持 vLLM 和 SGLang 推理框架,显存占用更低,适合 GPU 资源有限的部署场景。

产品发布
@Alibaba_Qwen 阅读 →

OpenAI:GPT-5.3 Instant 减少不必要拒绝和说教式免责声明

OpenAI 表示新版 GPT-5.3 Instant 减少了不必要的拒答行为和冗余的安全提示语。

大模型
@OpenAI 阅读 →

Google:Gemini 3.1 Flash-Lite 输出速度提升 45%,支持动态思维级别

Gemini 3.1 Flash-Lite 在 Google AI Studio 和 Vertex AI 开放预览,输出速度较 2.5 Flash 提升 45%,支持动态思维级别以匹配任务复杂度。

大模型
@Google 阅读 →

OpenAI:GPT-5.3 Instant 大幅减少「AI 味」回复

OpenAI 回应用户反馈,表示 GPT-5.3 Instant 大幅减少了过度讨好、油腻的回复风格。

大模型
@OpenAI 阅读 →

Google DeepMind:发布 Gemini 3.1 Flash-Lite,最高性价比 Gemini 3 系列模型

Gemini 3.1 Flash-Lite 正式发布,定位为 Gemini 3 系列中成本效率最高的模型,专为大规模智能应用打造。

大模型
@GoogleDeepMind 阅读 →

OpenAI:GPT-5.3 Instant 正式向所有用户推出

OpenAI 宣布 GPT-5.3 Instant 模型全面上线 ChatGPT,官方称该版本更准确、回复风格更自然。

大模型
@OpenAI 阅读 →

vLLM:与 nCompass 合作打造 GPU 性能分析工具链

vLLM 宣布与 nCompass 合作,将性能分析、追踪对比和 AI 辅助分析整合到工作流中,帮助生态定位瓶颈并提升整体性能。

行业
@vllm_project 阅读 →

swyx:AI Agent 正在终结代码审查流程,SDLC 将被颠覆

Latent Space 主理人 swyx 指出,多位开发者正在探索移除人工代码审查瓶颈,让 Agent 完全自主工作,预计 3-6 个月内将成为主流趋势。

观点
@swyx 阅读 →

n8n:发布 AI 输出评估模板,可对比 Gemini、Claude、GPT 等模型表现

n8n 发布新工作流模板,展示五种评估 AI 输出的方法,支持用 Google Sheets 对比多个模型表现并追踪结果变化趋势。

产品发布
@n8n_io 阅读 →

swyx:公开「如何成为思想领袖」方法论笔记

Latent Space 创始人 swyx 分享其多年整理的思想领袖方法论笔记,从讽刺出发变为真诚实践指南,并将与 mada299 合办第二场私人线上研讨会。

观点
@swyx 阅读 →

vLLM:本周四举办 RL 推理工作坊,SkyRL 分享 vLLM 在强化学习中的应用

vLLM 项目邀请 SkyRL 团队在本周四 LLMs on Ray 线上活动中分享 vLLM 在强化学习推理工作流中的实践经验。

大模型
@vllm_project 阅读 →

通义千问:确认 Qwen 3.5 小模型系列已上线 Ollama 平台

通义千问官方确认 Qwen 3.5 小模型系列已在 Ollama 平台上线,用户可通过命令行快速部署运行。

产品发布
@Alibaba_Qwen 阅读 →

Sam Altman:阐述 AI 治理四大原则——对齐、民主化、赋能与个体自主

Altman 在 OpenAI 与国防部合作决策背景下分享四项核心原则,强调民主进程必须掌控 AI 发展方向,AI 应实现民主化并赋能个体而非取代人类决策权。

观点
@sama 阅读 →

通义千问:Qwen3.5-9B 登陆 LM Studio,仅需约 7GB 即可本地运行

通义千问 Qwen3.5-9B 模型现已上线 LM Studio,本地运行仅需约 7GB 内存,大幅降低本地部署门槛。

产品发布
@Alibaba_Qwen 阅读 →

Sam Altman:公布与美国防部合作的 AI 安全原则,承诺不用于国内监控

OpenAI 将在与国防部协议中明确写入禁止用于美国国内监控条款,承诺遵守宪法第四修正案及相关国家安全法律,强调 AI 系统不得故意用于对美国公民的国内监视。

观点
@sama 阅读 →