来自 Twitter · Hacker News · GitHub 的 AI 行业动态
vLLM-Omni v0.18.0 发布,83 位贡献者提交 324 次 commit。新增 Qwen3-TTS/Omni、Fish Speech 等生产级 TTS 服务,重构扩散模型运行时,新增统一量化框架和 12+ 新模型支持。
Claude Code 新增 MCP 功能研究预览版,支持操作 Mac 上的任何应用程序,包括 SwiftUI 应用、Electron 构建和无 CLI 的 GUI 工具。Pro 和 Max 用户可在 macOS 上通过 /mcp 启用。
Claude Code 创建者 Boris Cherny 分享手机端编程、跨设备会话切换(teleport/remote-control)、语音编程、自动代码审查等 15 个实用功能。
Starcloud 从 YC Demo Day 到独角兽仅用 17 个月。去年发射首颗搭载 H100 GPU 的卫星,正在开发可从 Starship 发射的太空数据中心,目标与地面 AI 推理成本持平。
Ollama 发布 Pi 编程 Agent(驱动 OpenClaw 的底层工具),支持扩展、技能、模板和主题自定义,可与 Kimi K2.5 云端模型配合使用。
OpenAI 发布 codex-plugin-cc,在 Claude Code 里直接调用 Codex 做代码审查、对抗性审查和任务移交。竞争对手主动入驻对方插件生态。
Musk 表示 AI 的未来主要在视频理解和生成,因为光子是最高带宽的通信方式。同时透露 xAI 的 Imagine 已实现正毛利。
Claude Code + Computer Use 可在一个提示中完成代码编写、编译、启动应用、UI 点击测试、发现 Bug、修复并验证,支持 SwiftUI、Electron 等任何 Mac 应用。
Claude Code 的 Auto Mode 现已支持企业版和 API 用户,运行 claude --enable-auto-mode 即可启用。
Qwen3.5-Omni 支持文本、图像、音频、视频原生理解,亮点功能「音视觉 Vibe Coding」:对着摄像头描述想法,即时生成网站或游戏。
Claude Code 新增 Computer Use 功能,Claude 可以打开应用、点击 UI、测试代码,全程在 CLI 中完成。Pro 和 Max 用户可用,macOS 研究预览版。
Replit 的 Agent 4 Buildathon 黑客松第一周已有 4000 名开发者参赛,竞争激烈,官方发布首周进展更新。
AI 记忆基础设施公司 Mem0 宣布推出关于 AI Agent 记忆与上下文工程的系列文章,并向社区征集下一期想深入分析的记忆系统。
Runway 推出 Big Ad Contest,参赛者可使用 Ad Concepter App 创作广告创意,最高可赢得 10 万美元现金奖励。
LlamaIndex 发布深度文章,解析如何从 PDF 中智能提取表格数据,现代 OCR 技术需重建空间关系、保留表头层级并确保数据完整性,远比普通文本识别复杂。
二次创业的 YC 创始人推出 Sazabi,一个 AI 原生可观测性平台,能分析日志并回答「为什么生产环境宕机了」等问题,将数小时的排障缩短到几分钟。
GojiberryAI 是一款面向小型销售团队的 AI 工具,可自动在 LinkedIn 寻找有购买意向的潜客、发起对话、处理回复并预约演示,实现全自动获客。
n8n 与 Firecrawl 合作推出月度社区挑战,参赛者需构建网络爬取 Agent 解决实际客户问题,提供三个难度级别,优胜者将获得直播展示机会,截止 4 月 26 日。
北京智源研究院、北大、清华等 23 家机构在中关村论坛期间联合发布 FlagOS 2.0,这是面向多种 AI 芯片的统一开源系统软件栈的重大版本升级。
Google 推出 Gemini 3.1 Flash Live,专注低延迟多模态实时交互,支持语音、视觉和上下文即时响应,开发者可构建实时 AI 应用。
Apple 计划在 iOS 27 中允许用户通过 App Store 应用将任意 AI 服务接入 Siri,终结 ChatGPT 在 Apple Intelligence 中的独占地位。
Anthropic 为 Claude Code 推出 AutoDream 功能,可自动合并、修剪和重组跨会话的记忆文件,防止记忆膨胀。用户可通过 /dream 命令手动触发或设定自动运行。
前特斯拉高级经理解释马斯克设定超激进目标的真实目的:迫使团队深度思考瓶颈,从 1000 件任务中识别出真正影响进度的 100 件关键事项,形成优先级清单。
a16z 播客邀请能源专家解析沙特与美国石油供应成本差异,为科技从业者提供 AI 基础设施能源成本的底层视角。
知名投资人 Chamath 分享 Grok 的一段解释并表示赞赏,反映 AI 大模型在日常信息理解和解释方面的能力提升。
MIT CSAIL 分享了一张数据结构速查表,涵盖数组、链表、树、图等核心数据结构的特性和操作复杂度对比,适合开发者快速参考。
Anduril 总裁 Matthew Steckman 透露,2017 年首款感知塔的 CV AI 技术至今仍嵌入其自主战斗机系统中,展示了军事 AI 从边境监控到空战的技术传承路线。
Latent Space 主播 swyx 推荐 create-context-graph 工具,一条命令即可为 22 个主流行业领域建立关键实体关系图,可叠加社交图谱到任意应用中。
AI 研究者 AK 展示 Claude Code 结合 HuggingFace Papers CLI 工具,可自动检索、筛选和总结论文,实现 AI 辅助的自动化研究工作流。
Allen AI 发布 MolmoBot,一套完全在仿真环境中训练的开源机器人操作系统,包含代码、训练数据、数据生成管线和评估工具,无需大规模真实世界数据采集即可使用。