来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Yann LeCun 确认 Meta 在 AI 领域的投资正确答案是超过 45 亿美元,凸显科技巨头在 AI 基础设施上的持续大额投入。
Latent Space 主理人 swyx 分享 OpenCode 项目的开发准则:不因为能做就做新功能、让代码比接手时更好、修复流程优先于新功能。
LoGeR 提出一种结合混合记忆机制的长上下文几何重建方法,旨在改进 3D 场景理解和重建任务中的长程依赖建模。
ElevenLabs 宣布旗下 ElevenCreative 已拥有独立账号,该平台被数百万用户用于声音克隆、70+ 语言播客配音、音乐生成、创意制作和音效设计。
Elon Musk 在推特展示使用 Grok Imagine 生成图像,称制作起来太简单了,展现 xAI 图像生成产品的易用性。
针对 Forbes 报道称 Claude Code Max 消耗约 5000 美元算力的说法,Martin Alderson 撰文反驳:5000 美元是 API 零售价而非实际计算成本,参考开源模型定价,实际成本约为零售价的十分之一。
Google 为 AI Ultra 和 Pro 订阅用户推出一系列 Gemini 新功能,可在 Google 文档、表格、幻灯片和云端硬盘中更快地撰写、创作和完成工作。
AI KOL 宝玉认为,Dify 和 Cursor 虽然技术模式可能过时,但旧技术仍能带来现金流,团队会根据形势调整方向,投资的核心是人而非项目本身。
月之暗面旗下 AI 助手 Kimi 宣布入选全球 Top 50 生成式 AI 网页产品榜单,团队表示将继续专注产品打磨和迭代。
Dify 3000 万美元由红杉资本领投,五源资本等跟投。全球超 140 万台机器运行其服务,覆盖 175 个国家。资金用于 Agent 工作流稳定性和企业级功能。
开源 AI 应用开发平台 Dify 宣布完成 3000 万美元 Pre-A 轮融资,已有超 2000 个团队和 280 家企业在其平台构建 AI 工作流。
宝玉解读 OpenAI Harness Engineering,类比瓦特调速器和 K8s 控制器:工程师设计环境和反馈回路,由 AI Agent 执行编码。五个月百万行代码无一行手写。
Meta 首席 AI 科学家 Yann LeCun 宣布创办新公司 Advanced Machine Intelligence (AMI Labs),完成 10.3 亿美元种子轮融资,为欧洲公司史上最大种子轮之一。
Google 发布纪录片,讲述负责任 AI 副总裁 Marian Rogers Croak 博士的工作与贡献。
Karpathy 评论称,当前 LLM 能自主编写任意代码、从实验中学习并访问互联网,与过去的神经架构搜索(NAS)相比完全不在同一个级别,后者在对比下显得毫无用处。
Karpathy 分享了 autoresearch 项目,这是一种可交给 AI Agent 执行的自动化研究方案,用户可将其应用于自己关注的任何领域,周末引发广泛讨论。
Claude Code Review 优化深度审查,费用基于 Token 用量,单次审查平均 15-25 美元,随 PR 复杂度变化。另有开源 GitHub Action 可作为轻量替代方案。
Claude 推出 Code Review 功能,多个 Agent 并行查找 Bug,验证每个问题以减少误报,并按严重性排序,生成一条高信噪比的总结评论加行内标注。
开发者宝玉反映 ClawHub 上出现 Skill slug 被他人 fork 后抢先发布的情况,导致原作者无法更新自己的 Skill,呼吁平台建立所有权申诉和转让流程。
新论文 Penguin-VL 探索以 LLM 作为视觉编码器的视觉语言模型效率上限,提供在线 Demo 和论文全文。
宝玉详细解读 Claude Code Review 工作机制:多 Agent 并行查 bug、交叉验证过滤误报、按严重程度排序,大型 PR 分配更多 Agent 深度审查,平均审查时间约 20 分钟。目前仅 Team/Enterprise 用户可用。
Anthropic 公布 Code Review 内部测试数据:1000 行以上的大型 PR 中 84% 能发现实质问题,平均每个 PR 标记 7.5 个 issue,审查费用约 15-25 美元。
马斯克推荐 Grok Imagine 的 extend video 功能,用户可以将生成的短视频不断延长,串联成一个完整故事。
Karpathy 分享 autoresearch 自动调优实验,让 AI 自主寻找改进方案 2 天,发现约 20 项改进均可叠加迁移到更大模型,GPT-2 训练时间从 2.02 小时降至 1.80 小时。
Anthropic 发布 Claude Code 新功能 Code Review,PR 提交后自动派出多个 Agent 并行查找 bug、交叉验证过滤误报并按严重程度排序。内部测试数月,有实质审查意见的 PR 从 16% 提升至 54%,误判率不到 1%。
新论文 RoboMME 提出针对机器人通用策略的记忆能力基准,系统评估机器人在长期任务中的记忆理解和运用能力。
Anthropic 发布 Claude Code Review(Beta),因内部代码产出增长 200% 导致审查瓶颈而研发。系统自动派多个 Agent 并行搜索 Bug 并交叉验证,输出高信噪比总结 + 行内标注。内部数月实测:含实质性评审意见的 PR 从 16% 升至 54%,错误标记不到 1%,1000+ 行大 PR 中 84% 能发现问题。按 token 计费,平均每次 $15-25,Team 和 Enterprise 可用。信源:@claudeai @dotey
基于 LlamaParse 构建的 Surreal Slides,可将 PPT 解析为结构化数据并存入 SurrealDB,支持自然语言搜索整个演示文稿库。
新论文 KARL(Knowledge Agents via Reinforcement Learning)发布,探索用强化学习训练知识代理的方法。
ElevenLabs 将在 SXSW 首映纪录片《11 Voices》,讲述失声者用 AI 语音复原技术讲述自己故事的经历,是其帮助百万人重获声音计划的一部分。