来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Vercel 旗下 v0 发布 Browser Use 功能:v0 可以打开自己构建的应用、使用并评审设计、调试复杂流程,并在工作过程中实时把所见截图发回给用户。
Ollama 宣布在云端新增大量 Blackwell GPU 来服务 GLM-5.1 模型,并支持通过 ollama launch 启动 Claude Code、Codex App、Hermes Agent 等客户端。
OpenAI CEO 回应内部模型行为报告时承认:用户(包括他自己)对当前 AI 能力的预期被拉高得极快,「我已经习惯了现在的 magic,希望再多一点」——一句话讲清 LLM 行业的 hedonic treadmill 难题:感知红利远跑不过认知折旧。
Google 官号点名 5 月 19 日 10:00 PT 的 Google I/O 主舞台直播,明示将首发产品更新与 AI 突破。结合此前传闻的 Gemini 3.1 / Gemma 4 / Agent Builder 全家桶,本周下半段开发者关注焦点已经锁定。
Chamath 公开吐槽 Claude 的 PPT 上传交互:「先开新对话、删一些页、不要超过最大图片数⋯⋯就像我自己脑子一样」,开发者共鸣点直接戳到 Claude 长上下文 + 多模态 UX 的痛点,2470 点赞下方挤满 Anthropic Pro 用户跟帖。
Social Capital 创始人 Chamath 发布 AI 价值累积框架,按基础设施(土地/电网/冷却/矿物/晶圆)→ 模型 → 应用 → 工具 四层拆解,逐层指出价值如何沉淀、又如何向上层让渡——给一级市场投资人提供「下注哪一层」的判断脚手架。
Figure AI 公开了第三天的耐久测试:人形机器人连续 24 小时全自主作业,公司直播「跑到出故障为止」,把人形机器人能否稳定承担工厂级长时任务,从 demo 演示推到 endurance test 公开化阶段。
xAI 官宣 Grok 订阅用户可在 Nous Research 的 Hermes Agent 框架里直接接入,闭源 KOL 套餐第一次跟开源 Agent 生态打通——意味着 Grok-5 现在能被任意开发者塞进 Hermes 推理链做工具调用。
YC 总裁 Garry Tan 抛出 2026 投资圈最大反共识断言:现在用 OpenClaw 写代码 + Nous Hermes 推理 + GBrain 一站式入口(按 token 计费可冲到 $10k/月)的开发者,已经在用 2028 年才会普及的 AI 能力,每月只需 100 美元起步,这是相对竞争对手最大的单点解锁。
Ollama 0.24 现已支持 Codex App,用户通过 ollama launch codex-app 即可在 Codex 中选择开源模型使用。
NVIDIA 阐释从建议型 AI 到行动型 AI 的转变 —— 自主 Agent 24/7 在后台处理复杂工作,让用户专注于决策本身。
NVIDIA 黄仁勋向卡内基梅隆大学 2026 届毕业生表示,没有一代人拥有比你们更强的工具和更大的机遇,这是塑造未来的时刻。
Codex 移动预览版今日在所有支持地区的 iOS 与 Android 推出;连接手机与 Windows Codex App 的功能即将到来。
Figure 第二日直播显示,旗下人形机器人 Bob、Frank、Gary 在全自主模式下连续 24/7 运行 Helix-02 模型。
Anthropic 发表论文,阐述对中美 AI 竞争的立场,认为美国及民主盟友目前在前沿 AI 占据领先地位,并探讨保持领先所需举措。
OpenAI CEO Sam Altman 确认 Codex 已上线 ChatGPT 手机应用。
xAI 上线 Grok Build 早期 Beta —— 用于编码、构建应用和自动化工作流的 agentic 命令行工具,目前向 SuperGrok Heavy 订阅用户开放。
Codex 现可在 ChatGPT 手机应用中预览:手机端发起任务、审阅输出、引导执行并批准下一步,同时 Codex 仍在笔记本、Mac mini 或 devbox 上运行。
Elon Musk 邀请用户试用 xAI 新推出的 Grok Build 早期 Beta 版,并征集改进建议。
a16z 提出,未来十年的企业价值将由「智能系统」承载——它从记录系统中提取上下文并采取行动,成为用户的一站式入口,而数据库则退居 API 层。
Anthropic 发布 Claude for Small Business,把 AI 集成进 QuickBooks、PayPal、HubSpot、Canva、DocuSign 等小企业常用工具,含 15 个预设工作流 + 8 个连接器,覆盖工资核算、现金流预测、催款等场景,在 Claude Team / Enterprise 订阅之外不另收费。
宝玉在 baoyu-skills 中新增「微信群聊总结」Skill,依赖 wx-cli 读取数据,配合 Claude Code + Claude Opus 4.6 效果最佳。
月之暗面宣布 Kimi K2.6 在金融 Agent 基准测试 V2(Finance Agent Benchmark V2)上成为开源权重模型第一名。
Kimi 发布浏览器扩展 Web Bridge,Agent 可像人类一样搜索、滚动、点击、输入并完成任务,支持 Kimi Code CLI、Claude Code、Cursor、Codex 等,现已上架 Chrome 商店。
Anthropic 宣布与盖茨基金会合作,提供 2 亿美元的资助、Claude 额度和技术支持,用于全球健康、生命科学、教育、农业和经济流动等项目。
桑德斯和 AOC 提出法案要求暂停所有 AI 数据中心建设,全美已有 300+ 地方法案,半数 2026 年计划项目面临延期或取消。Garry Tan 批评此举阻碍重大就业机会。
Snap 工程平台负责人 Prudhvi Vatala 分享,其团队将每日 10 多 PB 的数据处理迁移到 Google Cloud 上的 GPU 加速管线,在零代码改动下将作业成本降低 76%、内存占用减少 80%。
YC 公司 Foresight 构建 AI 驱动的消费者模拟,让快消、零售和科技团队在几分钟内预测产品发布或营销活动的反响,在财富 500 强客户测试中相比传统调研达到 95% 准确率。
YC 公司 WithAI 正在构建一个指挥中心,让机构投资者与 AI 协作完成股票研究、组合监控等工作。
Anthropic 将 Claude Code 每周用量上限提升 50%,即刻生效至 7 月 13 日,覆盖 Pro、Max、Team 及企业版全部入口。此举叠加在上周 5 小时窗口翻倍之上,两个维度的限额同时放宽。