来自 Twitter · Hacker News · GitHub 的 AI 行业动态
MiniMax 最新大模型 M2.7 正式在 Hugging Face 开源发布,模型权重已可下载使用。
YC CEO Garry Tan 称赞 Google Gemini Live 2.5 语音代理是他见过最出色的,速度快、足够智能、上下文窗口大,并质疑为何 Amazon Alexa 和 Apple Siri 至今无法达到同等水平。
GBrain 0.9.0 正式发布,支持 AI 自动为用户定制配置。Garry Tan 称这标志着「个人 AI 软件」时代的到来——所有软件由 AI 按需实时生成。
Garry Tan 分享 AI Agent 架构理念:记忆和技能都是 Markdown 文件,大脑是 Git 仓库,harness 只是薄薄的导体层,不应拥有记忆。
Y Combinator 总裁 Garry Tan 表示,AI 即将让 CAD 和工程设计能力提升百倍,这一愿景可能正在变为现实。
Musk 发布了一句关于未来 AI 智能水平的简短评论,暗示 AI 的智能程度将远超人类当前的认知标准。
马斯克透露 Starlink V3 搭载 Starship 发射带宽将比 Falcon V2 提升 25-50 倍,Starship 年发射次数超 Falcon 百倍以上,每年将发射约 2 万颗约 2 吨重的通信卫星,其中大部分为 AI 卫星。
MiniMax M2.7 已上线 Together AI 平台。该模型通过自主运行强化学习循环进行训练,在 MLE Bench Lite 上取得开源模型最高分。
伯克利团队构建专门作弊的 AI 攻击 8 个主流评测基准,未调用任何大模型即获近满分。SWE-bench 仅用 10 行代码劫持 pytest 测试框架,500 道题全部通过;WebArena 标准答案直接存在本地文件中可被读取。
MiniMax M2.7 通过自主运行 RL 优化超 100 轮实现 30% 性能提升。MLE Bench Lite 66.6% 奖牌率(开源第一),SWE-Pro 56.22%,GDPval-AA ELO 1495(开源最高)。SGLang 首日支持。
vLLM 为 MiniMax M2.7 提供首日支持。该模型主打智能体优先设计,支持多智能体编排(Agent Teams)、生产级代码调试与安全分析,以及 Word/Excel/PPT 办公自动化。
MiniMax M2.7 已上线 Ollama 云平台并开放商业使用授权,支持通过 OpenClaw 启动编码智能体,也可直接 ollama run 对话。
GarryTan 转发文章称 AI 末日论者需要重新审视自己的价值观,暗示过度悲观的 AI 安全叙事可能阻碍技术进步。
推荐在 Claude Code 中打开 OpenClaw 仓库对其自身提交进行代码审查,既能捕获 bug 也能了解 Agent 的自我迭代进展。Trust but verify。
在夏威夷酒店池畔通过 Telegram 聊天完成 Agent 工程开发,为 GBrain 添加了改进的文件存储功能,支持 Supabase Files 私有链接通过 Edge Function 临时重定向访问。
世界上所有人类竞赛都将被一些闲聊和几十个 markdown 文件颠覆——暗示 AI Agent 的简单配置就能超越人类在各领域的表现。
对于 AI Agent 而言,当你想要发挥每一分可能的能力时,开源正在成为唯一可行的路径。
GBrain 是用户自主可控的开源个人 AI 项目,开源意味着不受 API 限制。在 AI 时代,保持在 API 线之上、掌握自己的 AI 认知工具比以往任何时候都更重要。
同时运行 Hermes 和 OpenClaw 两款 Agent,Hermes 更稳定不崩溃但较慢且缺乏个性,OpenClaw 个性更好、更主动但不够稳定。理想方案是将两者优势结合。
GBrain 更新到 v0.8.0,新增 Voice WebRTC 端点和 Twilio 号码,用户可通过语音直接与自己的 AI Agent 对话。已安装用户只需让 Agent 自行升级即可。
面对 SaaS 公司被 AI 替代的趋势,投资者有两个选择:认为替代周期即将结束可以抄底,或认为这只是开始——客户流失率上升、NDR 下降、RPO 被折价等信号值得密切关注。
成功后人们容易让生活变得复杂,拥有更多房产、车辆等,但复杂性会吞噬最宝贵的资产——时间。从做事变成管理琐事,从与工程师交流变成处理后勤。最好的玩家懂得保持简单。
MIT CSAIL 回顾日本科学家福岛邦彦 1980 年发表的 Neocognitron 论文,该神经网络架构直接启发了后来的卷积神经网络(CNN),奠定了深度学习视觉基础。
Garry Tan 连发多条推文盛赞 OpenClaw/Hermes Agent,认为其比 Claude、ChatGPT 等封闭式 AI 更自由,可完全自定义语音和技能,用过后不想回头。
Cursor 宣布本周末在新界面中将 Composer 2 使用量翻倍,用户可在 Agents 窗口选择 Composer 2 开始构建,不设每小时使用上限。
知名投资人 Chamath 指出,科技行业内部正出现 AI 赋能的超级工程师/PM/销售与普通员工之间的深刻分化,未来组织将更小、回报更集中、财富分配更不均。
Musk 透露 xAI 的 Grok 模型进度,预计今年 5 月接近 Claude Opus 4.6 水平,6 月有望追平甚至超越,他称这在 AI 领域已算漫长的等待。
YC CEO Garry Tan 宣布 GBrain 开源 AI 工具现已默认使用 PGLite(基于 WASM 的嵌入式 Postgres,支持向量搜索),用户无需配置 API Key 即可开箱使用。
Perplexity 举办 Computer 功能投资比赛,学生用 Perplexity Computer 进行两周股票研究后现场展示投资分析,前 5 名决赛选手角逐 1.75 万美元奖金。
针对新用户在集成邮件、日历等服务时遇到的困难,GBrain 推出引导式集成配置功能,帮助用户快速完成首次安装设置,更快达到千级甚至万级 Markdown 知识库规模。