来自 Twitter · Hacker News · GitHub 的 AI 行业动态
xAI 优化 Grok Build Beta 的缓存机制,并重置所有账号用量上限,以解决用户反馈的用量触顶过快问题,同时继续征集使用反馈。
Claude 团队展示 6 个均源于「Why not?」之问的内部实验项目,强调通过小实验持续孵化、推动产品迭代的思路。
Campfire 是面向高增长科技公司的 AI 原生 ERP,自 2024Q4 起 ARR 每季度翻倍;继 2025 年 6 月以 12 人完成 3500 万美元 A 轮后,本轮由 Accel、Ribbit Capital 领投,团队已扩至 100+ 人。
宝玉调侃 Moonshot 仍发布了 TypeScript 版 kimi-code,让人想起此前 kimicli 用 Python 是彻底的失败 的网络段子。
YC CEO Garry Tan 援引社区结论指出,阿里通义千问 Qwen2.5-7B Instruct 模型实际能力已接近 GPT-3.5-turbo。
Supabase 建议开发者在多数场景下用 getClaims() 替代 getUser(),可显著降低数据库压力、提升响应速度。
宝玉指出 Agent Harness 很难跑赢模型公司,模型升级常让工作白干;但基于成熟 Harness 构建 AI Native 工作流、重设 HITL 交互、整理垂直领域数据等仍是模型公司无法覆盖的机会。
Paul Graham 表示,由 AI 代写却以人类名义发出的邮件让人感到被欺骗,他从未有耐心读完此类邮件。
Anthropic 联合创始人 Chris Olah 受邀在教皇利奥十四世通谕《Magnifica humanitas》发布会上发言,相关演讲全文已公开。
xAI 推出 Grok Build Beta,集成 Plan 模式、Imagine 图像与视频生成、CLI 自动化等功能,面向 SuperGrok 和 X Premium+ 用户开放。
马斯克透露 xAI 的 Grok Build 还将处于 Beta 阶段约一个月,但目前已能在实际生产任务中发挥作用。
通义千问宣布 Qwen3.7-Max 已默认启用 Implicit Caching,无需任何配置自动生效,开箱即用就能更快更便宜;若需更高、更确定的命中率,可改用 Explicit Caching。
YC CEO Garry Tan 分享他连续构建 4 个 Agent(个人 AI + 公司大脑)的标准化流程:手工执行 → 封装成 Skill → 加入 cron 定时 → 验证可解性 → Evals 与集成测试 → 循环迭代。
Paul Graham 吐槽现在收到的创始人邮件大多写成「硬核新闻体」风格,明显是 AI 生成——以前从没创始人这样写过,一旦意识到是 AI 写的就会本能想忽略它。
宇树科技发布 WVLA 2.0 模型的会议室清理测试视频,单次拍摄完成多任务全自主操作,并能在强外部干扰下保持稳定。
马斯克回复表示,xAI 计划在今年年底前开源当前在线服务的 0.5T 参数 Grok 模型,称其仍会相当有用。
xAI 完成 Grok V9-Medium(1.5T 参数)基础模型训练,评测表现良好,补充训练加入大量 Cursor 数据;微调进行中,几天后开始强化学习,预计 2-3 周后发布,相较当前在线服务的 0.5T V8-small 在困难编码任务上将有重大提升。
马斯克宣布 xAI 的 Grok Build 产品正在以每周 7 天的节奏持续迭代优化。
NVIDIA 官号发布黄仁勋为粉丝签名的短视频,配文「Some people leave reviews. Jensen leaves his signature」,继续塑造 AI 芯片时代的「摇滚明星 CEO」人设。
Andrej Karpathy 透露,深度学习之父 Geoff Hinton 当年在 Google 的官方 title 一度被标记为「Intern(实习生)」,颇具反差喜剧效果。
Garry Tan 分享其 AI 产品 GBrain 的早期反馈:他本人每天都在投入开发,过去一周合并了 20 多个 PR,代码库年轻但迭代极快。
MiniMax 与 Storyverse 合作,用最新 Speech 2.8 语音模型为意大利犯罪剧集《Il Cinese》提供配音。模型能精准还原地方口音差异与人声特征,匹配角色设定和剧情氛围。
当 /goal 长任务执行很久却看不到进度时,可以用 /side 开一个侧边会话,不影响当前主任务、又能继承全部上下文,直接询问"目前进度如何?预计还要多久"等问题。
YC 创始人 Paul Graham 观察到,在大量使用 AI 之后他意识到,中位读者已无法连续阅读普通散文段落。这也解释了为什么近年出版的书大量由短小片段(类似杂志侧边栏)堆叠而成。
Garry Tan 宣布其 agentic coding 工具 GStack 已突破 10 万 GitHub Stars,数万人用它加速 AI 编码工作流和项目落地。
YC CEO Garry Tan 提出 Agent 设计新视角:当前 Agent 框架都在堆叠规划、推理等高级认知,却忽视了把无聊的重复任务变成"反射"。账单不是靠委员会付清的,而是靠定期扣款——好 Agent 应该把无趣事项交给条件反射,让复杂思考专注于真正复杂的问题。
GBrain 最新评测显示,在 LongMemEval 上比 MemPalace 高 1%、比 Vector RAG 高 38%,并在重排序与嵌入的成本、速度、召回率上达 SOTA。
Paul Graham 回应 Garry Tan,认为 18 岁辍学创业者缺乏在问题中沉淀的时间,更容易陷入造无人需要产品的陷阱。
YC 总裁观察到能成事的创始人都有从问题深处获得的独特洞察;失败者往往技术过硬却造无人需要的产品,并回避与真正用户的对话。
NVIDIA 官方分享团队在台北 Computex 期间逛夜市的轻松一幕,定格美食与街拍。