来自 Twitter · Hacker News · GitHub 的 AI 行业动态
Granite 4.1 LLMs: How They’re Built
OpenAI scales Stargate to build the compute infrastructure powering AGI, adding new data center capacity to meet growing AI demand.
OpenAI outlines a five-part action plan for strengthening cybersecurity in the Intelligence Age, focused on democratizing AI-powered cyber defense and protecting critical systems.
DeepInfra on Hugging Face Inference Providers 🔥
Y Combinator 专访 Google DeepMind 创始人 Demis Hassabis,回顾其 17 岁游戏设计师、神经科学博士到攻克围棋、AlphaFold 解蛋白质结构、获 2024 诺贝尔化学奖的历程,并谈论其推进 AGI 的目标。
宝玉直读 Hermes Agent 开源代码,揭示其四层记忆架构:MEMORY.md/USER.md 浓缩提示词记忆、SQLite 历史会话存档(可搜索)、像程序记忆运作的智能体技能管理,以及可选的 Honcho 用户建模层。
Qwen 团队发布 FlashQLA,基于 TileLang 构建的高性能线性注意力内核,前向加速 2-3 倍、反向加速 2 倍,专为个人设备上的 Agent 工作负载设计,含门驱动的卡内 CP、硬件友好代数重构、TileLang warp 专用融合内核三大机制。
swyx 称 DeepSeek v4 不刷榜也不秀训练成本,亮出 CSA/HCA/mHC 等 SOTA 长上下文效率技术,flash 定价仅为 pro 的 8%、opus 的约 1.1%,放出最强开源基模后退场,把后训练留给 Agent 实验室。
Claude 公布教育编程比赛铜奖,授予智利开发者 Paula Vasquez-Henriquez 的 Maieutic——一款强制学生在敲键盘前先解释要做什么和为什么的教学工具。
Anthropic Fellows 新研究提出"内省适配器"工具,让语言模型自报训练中习得的行为,包括潜在的对齐偏差,用于检测模型隐藏倾向。
Anthropic 用 99 道真实生物数据题对比 Claude 与专家小组,专家在 23 题上无解,最新模型解出其中约 30%,并攻克剩余大部分题目。
通义千问推出基于 TileLang 的 FlashQLA:前向 2-3 倍、后向 2 倍加速,专为端侧 Agentic AI 设计,在小模型、长上下文与张量并行场景下收益尤为明显。
微软 FY26 Q3 财报创纪录:营收 829 亿美元,AI 业务年化运行率突破 370 亿美元,Azure 同比增长 40%(按固定汇率 39%),Microsoft 365 Copilot 付费席位超过 2000 万。
OpenAI 启动 DevDay 2026 门票挑战赛,每周从基于 GPT-5.5 + Image Gen 的作品中挑选 2-3 个获胜者,由 Codex 协助初筛、官方团队定夺。
OpenAI 介绍 Codex 不止于写代码,还能处理资料整理、表格、演示稿、摘要等围绕主线工作的辅助任务。
Figure AI 公布 F.03 人形机器人在 BotQ 工厂的量产进展:120 天内日产能从 1 台提升至 1 台/小时,本周将生产 55 台。
OpenAI 官宣 DevDay 2026 回归,时间定在 9 月 29 日,地点旧金山。
Paul Graham 拜访 Legora 后表示,这家公司将在 2027 年超越 Harvey,未来唯一可能的对手只剩大模型厂商,而法律恰是少数能抵御模型公司侵入的领域。
土耳其开发者 Bedirhan Keskin 凭借基于语音的临床模拟器 MedKit 获得金奖,可让医学生练习问诊、开化验、做诊断,并依据最新指南对推理过程评分。
Anthropic 与 cerebral_valley 联合举办的 Claude Code 黑客松收官,参与者使用 Opus 4.7 进行了一周开发,官方公布了获奖作品名单。
Cursor 发布 SDK,开发者可使用与 Cursor 相同的运行时、框架和模型,在 CI/CD、自动化流程或自有产品中嵌入 Agent。
Sam Altman 表示,OpenAI 的 Codex 编码 Agent 正迎来一波类似 ChatGPT 当年的爆发期。
微软 1 月开源的 9B 参数语音转文字模型 VibeVoice-ASR 单次可处理 60 分钟音频。Simon Willison 在 M5 Max MacBook 跑 4-bit 量化版,转写 1 小时播客耗时 8 分 45 秒。
YC CEO Garry Tan 抨击旧金山禁建 AI 数据中心提案,称此举将摧毁本地就业、税基,并把 AI 竞赛拱手让给中国。
Sam Altman 在 X 上预告 OpenAI 接下来几次更新值得期待,并称团队成员 ajambrosino 表现亮眼。
DeepSeek 官方宣布 V4-Pro 折扣促销延期至 2026 年 5 月 31 日 15:59 UTC,开发者可继续享受降价 API 调用。
For decades, computational biology has operated under a reductionist compromise. To fit complex biological systems into the limited memory of a single GPU,...
Agentic systems often reason across screens, documents, audio, video, and text within a single perception‑to‑action loop. However, they still rely on...
Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents
The subsurface industry is at a critical point in its digital evolution. For decades, unlocking reservoir potential has relied on experts performing essential...