来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Qwen3.6-35B-A3B 在多项关键编码基准上超越密集 27B 参数的 Qwen3.5-27B,并在 Agent 编码与推理任务上大幅超越直接前代 Qwen3.5-35B-A3B。
Codex 现已支持 90 余个插件,可在文档、项目管理、代码审查、创意和部署等工具中获取上下文并执行操作。
Physical Intelligence 联合创始人 Quan Vuong 做客 Lightcone Podcast,介绍跨本体训练的机器人基础模型,零样本完成过去需数百小时数据才能掌握的任务,被称为机器人领域的 GPT 时刻。
Runway 宣布 Seedance 2.0 已在平台提供 1080P 分辨率输出,画面细节更丰富,可放大观看。
Paul Graham 尝试用 ChatGPT 与 Google 互相校对一块手表的出厂年份,结果两者反复采纳对方答案来回切换,展示大模型容易被引导的现象。
OpenAI 宣布 Codex 桌面应用新一轮更新今日起开始灰度推送,继续强化本地编码体验。
OpenAI 推出生命科学模型系列研究预览版,Amgen、Moderna、Allen Institute、Thermo Fisher 等合作机构今起可通过 ChatGPT、Codex 和 API 调用。
Cursor 与芝加哥大学经济学家 Suproteem Sarkar 合作研究了 500 支团队的使用数据,发现随着更强模型落地,开发者今年承担的高复杂度任务同比增长 68%。
Google 为 Gemini App 引入 Personal Intelligence 与 Nano Banana 2,用户可更便捷地生成反映个人生活与兴趣的图像,整个过程保持完全可控。
OpenAI 指出美国新药从靶点发现到获批平均耗时 10–15 年,先进 AI 系统能帮助科学家更快形成假设、发现潜在关联,加速药物研发流程。
NVIDIA 祝贺 OpenAI 将 Codex 扩展到更多软件工作流环节,Codex 正演变为覆盖开发者跨工具协作、长任务执行的系统级产品。
用户现可在 Codex 中使用 gpt-image-1.5 生成并迭代图像,支持前端设计、原型、游戏素材等场景,使用额度包含在 ChatGPT 账户中,无需 API Key。
OpenAI 推出 GPT-Rosalind 生命科学模型系列,针对科学工作流优化,在蛋白质与化学推理、基因组分析、生物化学知识以及科研工具调用方面表现更强。
Sam Altman 披露 Codex 现已具备从用户经验中学习的能力,能主动建议可执行的任务,同时新增应用内浏览器和大量插件。
OpenAI CEO Sam Altman 对用户从其他 AI 编码工具迁移到 Codex 表示欢迎,并调侃负责人 Tibo 不要对他限速或分配较弱的模型。
Perplexity 宣布 Claude Opus 4.7 担任 Computer 产品的默认编排模型,同时向 Max 订阅者在 Web、iOS 与 Android 端开放使用。
Google Chrome 新搜索体验允许用户在 AI Mode 旁并排打开网页,无需切换标签即可对比细节并追问,保留搜索上下文。
通过 macOS computer use,Codex 可自行看、点击、输入以操作任意应用,后台运行不占用户桌面,适用于前端迭代、应用测试等无 API 场景。
GPT-Rosalind 是 OpenAI 推出的前沿推理模型,专为生物学、药物发现与转化医学研究设计。
Sam Altman 表示 Codex 的 computer use 是重要升级,能够并行调用 Mac 上的所有应用,且不干扰用户自己的操作。
Anthropic 宣布 Claude Opus 4.7 即日起在 claude.ai、Claude Platform 以及所有主要云平台提供。
Codex 新版可调用 Mac 上的应用、连接更多工具、生成图像,能从过往操作中学习并承担持续性、可重复的任务。
Perplexity 发布 Personal Computer,基于 Mac App 实现跨本地文件、原生应用与浏览器的安全编排,今日起向 Max 订阅者及候补用户开放。
Ollama 宣布 Qwen 3.6 开源版已上线,支持本地运行并强化 Agent 编码能力;用户可直接在 Claude Code 或 OpenClaw 中调用 qwen3.6 模型。
Garry Tan 点评 Gemini Voice 体验遥遥领先,并预告该能力将很快在 GBrain 以及 OpenClaw/Hermes 上线。
Google DeepMind 宣布与 Boston Dynamics 合作,用 Gemini Robotics 具身推理模型驱动 Spot 机器人,使其更好理解环境、识别物体并执行整理房间等简单指令。
Elon Musk 在推文中确认,Grok Build 应用与对应终端将于下周进入 Beta 测试阶段。
Paul Graham 表示,最近常听到此前表现尚可但不突出的初创公司,因借力 AI 而出现增长加速,AI 正把应有的增长带给踏实工作的创始人。
Anthropic 在 API 侧引入介于 high 与 max 之间的 xhigh 推理档,可在难题上精细调节推理与延迟;同时上线 beta 版任务预算,帮助 Claude 在长周期任务中分配优先级与成本。
Claude Code 新增 /ultrareview 命令,会开启专门 review 会话逐行审读改动并指出严谨审查者会发现的问题;auto 模式同步向 Max 用户开放,让长任务减少中断。