来自 Twitter · Hacker News · GitHub 的 AI 行业动态
OpenAI 推出 GPT-Rosalind 生命科学模型系列,针对科学工作流优化,在蛋白质与化学推理、基因组分析、生物化学知识以及科研工具调用方面表现更强。
Sam Altman 披露 Codex 现已具备从用户经验中学习的能力,能主动建议可执行的任务,同时新增应用内浏览器和大量插件。
OpenAI CEO Sam Altman 对用户从其他 AI 编码工具迁移到 Codex 表示欢迎,并调侃负责人 Tibo 不要对他限速或分配较弱的模型。
Perplexity 宣布 Claude Opus 4.7 担任 Computer 产品的默认编排模型,同时向 Max 订阅者在 Web、iOS 与 Android 端开放使用。
Google Chrome 新搜索体验允许用户在 AI Mode 旁并排打开网页,无需切换标签即可对比细节并追问,保留搜索上下文。
通过 macOS computer use,Codex 可自行看、点击、输入以操作任意应用,后台运行不占用户桌面,适用于前端迭代、应用测试等无 API 场景。
GPT-Rosalind 是 OpenAI 推出的前沿推理模型,专为生物学、药物发现与转化医学研究设计。
Sam Altman 表示 Codex 的 computer use 是重要升级,能够并行调用 Mac 上的所有应用,且不干扰用户自己的操作。
Anthropic 宣布 Claude Opus 4.7 即日起在 claude.ai、Claude Platform 以及所有主要云平台提供。
Codex 新版可调用 Mac 上的应用、连接更多工具、生成图像,能从过往操作中学习并承担持续性、可重复的任务。
Perplexity 发布 Personal Computer,基于 Mac App 实现跨本地文件、原生应用与浏览器的安全编排,今日起向 Max 订阅者及候补用户开放。
Ollama 宣布 Qwen 3.6 开源版已上线,支持本地运行并强化 Agent 编码能力;用户可直接在 Claude Code 或 OpenClaw 中调用 qwen3.6 模型。
Garry Tan 点评 Gemini Voice 体验遥遥领先,并预告该能力将很快在 GBrain 以及 OpenClaw/Hermes 上线。
Google DeepMind 宣布与 Boston Dynamics 合作,用 Gemini Robotics 具身推理模型驱动 Spot 机器人,使其更好理解环境、识别物体并执行整理房间等简单指令。
Elon Musk 在推文中确认,Grok Build 应用与对应终端将于下周进入 Beta 测试阶段。
Paul Graham 表示,最近常听到此前表现尚可但不突出的初创公司,因借力 AI 而出现增长加速,AI 正把应有的增长带给踏实工作的创始人。
Anthropic 在 API 侧引入介于 high 与 max 之间的 xhigh 推理档,可在难题上精细调节推理与延迟;同时上线 beta 版任务预算,帮助 Claude 在长周期任务中分配优先级与成本。
Claude Code 新增 /ultrareview 命令,会开启专门 review 会话逐行审读改动并指出严谨审查者会发现的问题;auto 模式同步向 Max 用户开放,让长任务减少中断。
Anthropic 表示 Opus 4.7 视觉大幅升级,可识别分辨率较此前提升三倍以上,由此能生成质量更高的界面、幻灯片与文档。
Cursor 宣布集成 Claude Opus 4.7,官方称实测其自主性强、推理更具创造力,新模型以 50% 优惠价限时供用户使用。
阿里开源稀疏 MoE 模型 Qwen3.6-35B-A3B,总参 35B、激活 3B,Apache 2.0 协议;声称编码 Agent 能力可比肩激活量 10 倍的模型,支持多模态思考与非思考双模式。
Anthropic 推出迄今最强 Opus 模型 4.7,声称在长周期任务中执行更严谨、指令遵循更精确,并会在汇报结果前自行验证输出,允许减少人工监督。
若石新博客提出 Harness Engineering——给 AI Agent 装上"安全带"的工程实践。继 Prompt 和 Context 工程之后的新阶段,通过 Schema 约束、外置关键状态等原则解决多步自主执行中的崩溃问题。
Chamath Palihapitiya 在 All-In 播客中警告,每次重大 AI 模型突破都让量子破解日临近,这一风险真实存在且日益紧迫。
Together AI 的 VP of Kernels Dan Fu 与 UCSD 团队发布 Parcae 架构,首次稳定实现激活值多次通过同一层,让 770M 参数模型达到 1.3B Transformer 质量——非压缩路径,而是全新架构。
Y Combinator CEO Garry Tan 评论称,在 AI 时代下,封闭式平台生态(围墙花园)的商业模式将无法继续维持。
OpenClaw 背后的 Agent 框架 pi 核心维护者 Mario Zechner 宣布:未事先申请批准的 issue 和 PR 将被机器人自动关闭。原因是每天收到 30-50 条 AI 自动生成的垃圾贡献,优质贡献者可获 lgtm 标签豁免。
Keyframe Labs 让开发者和企业能在几分钟内为 AI 代理和应用接入照片级逼真的对话数字人,支持自然的视频通话交互。
OpenAI 为 Agents SDK 新增沙箱执行环境与模型原生 Harness,支持文件读写、代码执行、依赖安装与状态保存。兼容 Cloudflare、Vercel、Modal、E2B、Daytona 等云厂商,还提供 Manifest 统一配置层。
NVIDIA 强调决定推理 TCO 的关键指标是单 Token 成本而非算力或每美元 FLOPS。Blackwell 通过 CoreWeave、NebiusAI、Nscale、Together 等合作方提供业界最低单 Token 成本。