来自 Twitter · Hacker News · GitHub 的 AI 行业动态
YC 公司 Rudus 发布 AI 工程量估算平台,将原本需 100 多小时人工描图的单次投标流程自动化,让团队无需扩招即可承接 3-5 倍的工作量。
swyx 提出 Agent 自主性的递进层级:skill 是预设提示词,plan 是人类精炼的输入,goal 则由 AI 自行评估输出,自主程度逐级提升。
NVIDIA 宣布与 IneffableLabs 合作,共同设计面向大规模强化学习 Agent 的基础设施,探索构建可让 Agent 在各知识领域实现突破的训练管线,加速科学与产业发现。
a16z 合伙人 Seema Amble 撰文指出,随着记录系统巨头转向无头 Agent,新一代系统正变得「代理化」——捕获上下文、发起工作并记录数据。创业公司将围绕专有数据、行动层所有权和真实世界执行展开竞争。
Perplexity 公布企业客户案例——PayPal 团队每周在 Perplexity Enterprise 上运行 7.4 万个任务,用于模型验证、渠道表现、市场趋势研究、竞品情报与产品分析。
Runway 推出 Runway Agent,定位 AI 创意搭档——通过简单对话帮用户构思并产出完整的、含音效与剪辑的视频,覆盖广告、短片到社交内容。
Perplexity 介绍其 Computer 产品的安全设计——每个任务运行在独立的硬件隔离沙箱,VPC 级存储与计算分离;Agent 用短时效代理令牌而非原始 API key 认证。
NVIDIA 与 SAP 合作,把安全、治理与执行控制内置进 SAP Business AI Platform;NVIDIA OpenShell 帮助团队将 Agent 从开发推进到金融、采购、供应链等场景的可信生产部署。
YC 公司 Adialante 推出移动 MRI,将扫描成本降至每次数百美元、等待时间缩短到数小时,目标是让年度癌症筛查成为常态。
a16z 合伙人 Seema Amble 分析 Salesforce 开放 API、推出无头产品的战略——在 Agentic 世界里价值押注在数据层而非 UI,并探讨剥离 UI 后企业的真正壁垒。
Cursor 上线新功能,云端 Agent 可在预先配置好的开发环境中运行——像给工程师配笔记本一样克隆仓库、安装依赖、配置工具链凭证。
Altman 表示用不上最聪明的模型会让他焦虑,但有时也不介意速度慢;他在思考 AI 产品是否该把重心更多放在价格 / 速度的权衡上。
Figure 直播展示 Figure 03 机器人运行 Helix-02 系统、连续 8 小时零人工干预完成物流分拣,Figure 称吞吐量达人类水平(公司自评,未经第三方验证);这是公开演示,非客户部署。
Sam Altman 宣布未来 30 天内,想试用 Codex 的企业可获得两个月免费使用额度,他称 Codex 是目前最好的 AI 编码产品,希望降低企业切换门槛。
阿里 Qwen3.6-Plus 上线 Nous Research 的 Hermes Agent 平台,限时免费开放体验。
Garry Tan 自述其开源的 GBrain 项目 72 小时内合并 14 个 PR、净增近 2.8 万行代码,新增热记忆层、实时事实抽取、5 套 embedding 配方等能力(数字为其本人通报)。
YC 项目 Aseon Labs 打造盒装机器人维护站,可在运营区域内为自动驾驶车队完成充电、清洗与检测。
YC 项目 InstaAgent 帮 B2C 公司把营销活动规模化到数百个细分人群、跨数百个社交账号定制投放并持续优化,10 个月内 ARR 突破 100 万美元。
Long Lake 达成协议、以约 63 亿美元收购百年美企 American Express Global Business Travel(Amex GBT),计划用 AI 改造业务;Elad Gil 称这是首例 AI 驱动的上市公司私有化,交易预计今年下半年交割。
Anthropic 推出 Claude for Legal:12 个细分法律领域插件 + 20 多个 MCP 连接器,集成 Thomson Reuters CoCounsel、LexisNexis 等工具,Freshfields 等律所已在实际案件中使用。
Hugging Face Hub 的交互式 demo 应用 Spaces 数量突破 100 万;平台同时托管超 200 万公开模型与 50 万+ 公开数据集。
Claude 应用推出 Magic Wand 小彩蛋,用户只需摇晃设备即可在亮色与暗色模式之间切换。
Runway 首届「Shows That Do not Exist Yet」Big Pitch 创意大赛公布 20 位获奖者,展示 AI 视频时代的原创剧集提案。
在卡内基梅隆大学 2026 毕业典礼上,黄仁勋呼吁面对 AI 时保持乐观、责任与雄心,指引而非畏惧未来。
Perplexity 公布在 GB200 NVL72 Blackwell 机柜上部署后训练 Qwen3 235B 的研究,证明 GB200 在大 MoE 高吞吐推理上对 Hopper 实现重大跨越,而非仅是训练平台。
Cursor 推出 Claude Opus 4.7 Fast 模式,输出速度提升 2.5 倍但成本是标准的 6 倍,建议大多数场景仍用标准速度。
Android Auto 全面升级视觉适配各类车机屏,新增高级娱乐功能,并接入更强 Gemini 辅助驾驶体验。
Anthropic 在 Code with Claude 活动上向参与者发放小型计算机,展示用户用 Claude 创造的轻巧而精妙的项目。
Paul Graham 评论 Musk vs Altman 案揭示 AI 远比所有人 2015 年预期更有前景,Sam 当年没意识到 AI 价值远超捐款规模。
Gemini Intelligence 将最强 Gemini 能力带入旗舰设备,融合高端硬件与创新软件,主动帮用户完成日常任务。