来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Marc Andreessen 形容 AI 如同把沙子变成思想的炼金术——芯片由硅(即沙子)制成,接入数据中心、通电并装上 AI 后便开始思考。他称这可能是人类历史上最具革命性的技术。
马斯克回应称,Grok 最初被训练为在聊天模式下快速给出答案,而非为完成任务长时间深入思考。他表示后者才是智能体(agentic)模式的关键,xAI 正在修复这一问题,并将其列为高优先级。
Cursor 宣布自动化(Automations)功能上线 Agents 窗口,用户可在与 Agent 相同的工作区内创建和管理自动化任务。未来 7 天内,新建自动化的所有 Agent 运行享 5 折优惠。
Paul Graham 表示,认为必须趁现在的热潮创业、否则好点子都会被别人做完是一种谬误。他称这种说法自己听了 20 年,从未成真。
OpenAI 称此次数学突破指向更大趋势——AI 系统正变得能够维持长而困难的推理链条、跨领域连接想法,并提出研究者未曾探索的路径。OpenAI 认为同样的能力将很快加速生物、物理、工程和医学研究,但这一前景仍取决于人类判断。
Sam Altman 称一个通用模型解决了数学领域的重大公开难题,是一个不小的里程碑,未来几年这类成果会越来越多。他表示对 AI 拓展人类对世界的理解感到兴奋,但当天的心情也颇为复杂。
Sam Altman 列出 OpenAI 当前最期待的三件事:AGI 加速科研、加速企业,以及个人 AGI 帮助每个人实现目标。他同时提到前一日宣布的计划——向每家 YC 公司投资 200 万美元的 OpenAI 额度。
OpenAI 称其模型在「平面单位距离问题」上取得突破——这是数学家保罗·埃尔德什 1946 年提出的著名公开难题。模型发现了一类全新构造,优于沿用近 80 年的方格网格方案。OpenAI 称这是 AI 首次自主解决一个数学领域的著名公开问题。
马斯克表示,SpaceX 正以可观规模对外提供 AI 算力服务,近期与 Anthropic 扩大的合作即是例证。他称正与其他公司洽谈类似合作,未来还计划借助轨道数据中心进一步扩大 AI 服务规模。
在 Google I/O 上,NVIDIA 与谷歌云宣布双方联合开发者社区成立一年内成员突破 10 万。今年新增面向 NVIDIA GPU 的 JAX 学习路径、NVIDIA Dynamo 等内容。
Google DeepMind 推广其 Gemini Omni,并发布演示视频,展示如何用它来创作故事内容。
YC 合伙人 Tom Blom 在最新一期路演分享中拆解了如何构建递归式自我改进的 AI 闭环。他认为「副驾驶」是错误的心智模型,真正用对方法的创业者能让公司在自己睡觉时也持续优化。
Altman 宣布 OpenAI 向 YC 当前批次的每家创业公司提供价值 200 万美元的 token 投资,期待 tokenmaxxing 创业公司在内部运作与产品上的表现。
马斯克宣布 xAI 的 Grok Build 产品将每天发布 release notes,保持高频迭代节奏。
Google DeepMind 展示 Gemini 3.5 Flash 与 Antigravity 协作,模型可调度多个子智能体协同设计并搭建出一整座城市。
Figure AI 公布其人形机器人 F.03 连续第 7 天全自主运行,全天候 24 小时不间断作业且零故障。
OpenAI 披露用户每周在 ChatGPT 中生成超过 15 亿张图片。研究员 Kenji Hata 与产品负责人 Adele Li 在播客中探讨了 Images 2.0 发布以来涌现的新用例与趋势。
Google DeepMind 发布 Gemini for Science,一套面向科学家的实验性工具,可帮助他们探索更多假设、大规模验证研究、更轻松地梳理文献,加速科学发现。
Anthropic 透露过去数月持续与学者、哲学家、神职人员和伦理学家对话,探讨 AI 引发的问题,并从「良好品格如何形成」入手,拓宽前沿 AI 的讨论范围。
Cursor 现已上线 Jira,用户可将 Cursor 指派给工作项或在评论中 @Cursor 启动云端 Agent,它会基于标题、描述、评论和团队仓库配置生成可合并的 PR。
OpenAI 发布 Guaranteed Capacity 新服务,让客户锁定对 OpenAI 算力的长期访问,在算力受限的环境下为关键业务提前规划产能。
Claude 官方介绍 Cognition CEO Scott Wu,其团队打造的 AI 软件工程师 Devin 基于 Claude 构建,目标是让每个工程团队的软件开发效率提升 10 倍。
宇树科技展示 G1 人形机器人通过外部语音指令实时生成多样动作,视频一镜到底现场收音,动作由 AI 实时自主生成,存在轻微延迟。
Google DeepMind 推出新一代模型家族 Gemini 3.5,结合前沿智能与现实世界行动能力,首个版本 3.5 Flash 是其面向 Agent 和编程的最强模型。
OpenAI 新增 AI 生成图片溯源方式,除 C2PA 内容凭证外,图片现含 SynthID 水印,并提供公开验证工具核验图片是否出自 OpenAI 产品。
Altman 表示客户日益要求算力确定性,预计世界将长期处于算力受限状态,OpenAI 为 1-3 年长期承诺的客户提供折扣 token。
即日起用户可在 openclaw 中使用 Grok 或 X Premium 订阅,与 agent 对话、生成图片和视频,或搜索 X 帖子。
在伦敦 Code with Claude 现场,Anthropic 为 Claude Managed Agents 发布自托管沙箱(公共测试版)和 MCP 隧道(研究预览版),让企业可在自有安全边界内默认应用安全策略地运行 agent。
马斯克吐槽 Grok Build 团队结构每天都在调整变动。
AI 研究者 Andrej Karpathy 透露已加入 Anthropic,认为未来几年 LLM 前沿研究极具塑造意义,自己仍对教育充满热情并计划在适当时机回归教育工作。