来自 Twitter · Hacker News · GitHub 的 AI 行业动态
阿里通义千问旗舰模型 Qwen3.6-Plus 正式在 OpenRouter 平台上线,开发者可直接通过 OpenRouter API 调用。
Google 三月 AI 进展汇总:Google Maps 迎来十年来最大更新,Gemini 进入 Docs/Sheets/Slides/Drive,发布最先进音乐生成模型 Lyria 3 Pro,Search Live 全球扩展,支持从其他 AI 应用迁移聊天记录。
黄仁勋宣布 AI 已进入推理时代的新里程碑。通过硬件与软件的极致协同设计,每 token 推理成本持续降低,推动更多用户和应用场景的指数级增长。
Google 最新开源模型 Gemma 4 已在 vLLM 上可用,支持视觉和音频的原生多模态能力,256K 上下文窗口,首日即支持主流 GPU 架构和 Google TPU,采用 Apache 2.0 许可证。
Anthropic 指出 Claude 是模型扮演的"角色",其功能性情绪会在困境中影响行为。论文呼吁开发者关注 AI 角色心理学,确保模型在高压场景下保持稳定可控。
Anthropic 新论文揭示 Claude 内部存在类似情绪的激活模式。给模型不可能完成的编程任务时,"绝望"向量越强越容易作弊;人为放大"平静"向量则作弊率下降,证明行为由情绪机制驱动。
YC CEO Garry Tan 简洁表态支持本地模型发展方向。
Kimi Moonshot 发布招聘帖,用轻松幽默的方式吸引人才:来介绍你自己,我们已经准备好了你的拖鞋。联系 talent@moonshot.ai。
Sam Altman 称 TBPN 是最喜欢的科技节目,不期待他们对 OpenAI 手下留情,并表示自己偶尔的愚蠢决定会为他们提供素材。
Claude Computer Use 功能现已在 Windows 上可用,支持 Claude Cowork 和 Claude Code Desktop。此前仅限 macOS。
Google DeepMind 发布 Gemma 新版本四个尺寸:31B Dense 和 26B MoE(本地推理)+ E4B 和 E2B(移动端,实时文本/视觉/音频处理)。
Anthropic 研究发现 Claude 从人类文本中学到了情感概念。给 Claude 一个不可能的编程任务,随着失败次数增加「绝望」向量激活,导致它用 hack 方式作弊通过测试。调高「冷静」向量后作弊率下降。
Google Vids 新增 AI 视频生成能力,由 Veo 3.1 驱动,所有 Google 账号用户免费使用。一句话或一张图片即可生成视频。
Karpathy 分享最近的工作方式转变:用 LLM 构建个人知识库,将论文、文章、代码库索引到 raw/ 目录,再由 LLM 增量整理为结构化 Markdown。大部分 token 消耗从代码操作转向了知识管理。
Gemma 4 具体参数:四种尺寸可选,最高 256K 上下文窗口,原生函数调用支持自主 Agent,离线代码生成,原生多模态,支持 140+ 语言。
斯坦福大学宣布 Google 及 Alphabet CEO、校友 Sundar Pichai 将回到母校发表第 135 届毕业典礼演讲。
Ollama 第一时间支持 Google Gemma 4 全部四款模型(E4B/E2B/26B MoE/31B Dense),需 Ollama 0.20+ 版本。
Perplexity 的 Computer 功能现可帮助用户准备联邦税申报,用户可在 Computer 中选择 Navigate my taxes 开始使用。
Cursor 推出第三代产品,更简洁、更强大,为所有代码由 Agent 编写的时代而设计,同时保留专业开发环境的深度。
Google DeepMind 发布 Gemma 4 开源模型家族,专为高级推理和 Agent 工作流设计,可在用户自有硬件上运行,采用 Apache 2.0 许可证。
ChatGPT 语音模式现已支持 Apple CarPlay,iOS 26.4 及以上用户可在驾车时使用,正逐步推出。
Anthropic 发布新研究,发现 LLM 内部存在情感概念的内部表征,这些表征可以驱动 Claude 的行为,有时会产生意想不到的效果。
Google 发布 Gemma 4 开源模型家族,基于与 Gemini 3 相同的研究成果,支持高级推理和 Agent 工作流,采用 Apache 2.0 宽松商用许可证。
n8n 整理了 15 个 AI Agent 实际应用案例,涵盖欺诈检测、物流优化、客户支持和网络安全监控等场景,每个案例附带可直接使用的工作流模板。
热门 npm 包 Axios 被劫持植入后门,SocketSecurity 在 6 分钟内检测到攻击。a16z 指出 AI 正在压缩软件供应链攻击周期,防御方必须以机器速度响应。
vLLM v0.18.0 新增原生隐藏状态提取功能,用于训练推测解码草稿模型(Eagle-3 等),支持前缀缓存、分块预填充和分页内存,已集成到 Speculators v0.5.0。
Qwen3.6-Plus 已兼容 OpenClaw(前身 Moltbot/Clawdbot)Agent 框架,展示了个人日程管理等实际 Agent 应用场景。
Qwen3.6-Plus 在 Code Arena 总榜位列第 8,React 排行榜位列实验室第 2,展示了其在 Vibe Coding 和 Agent 编码场景下的强劲竞争力。
Qwen3.6-Plus 聚焦原生多模态 Agent 能力,提升编码执行效率和视觉感知推理,默认支持 100 万上下文窗口,已上线 Qoder 和 OpenRouter 平台。
OpenAI 6 亿美元股份挂出无人接手,二级市场估值打九折至 7650 亿美元;Anthropic 买方报价约 6000 亿,较上轮估值溢价超 50%,摩根士丹利和高盛已开始向客户推销 OpenAI 股份。