人工智能行业最新动态
Browserbase 将于 4 月 8 日在旧金山 MOMA 联合举办 AI After Hours 活动,面向 AI Agent、基础设施和工具领域的从业者和投资人,需申请入场。
Supabase 发布 Analytics Buckets,基于 Apache Iceberg 和 AWS S3 构建列式存储,兼容 Postgres 接口,专为分析型工作负载设计。
Vercel 旗下 AI 编程工具 v0 将参加 SXSW 大会,提供 Agent 构建实战体验,参与者可带走可上线的项目成果。
Latent Space 主播 swyx 透露 Cognition(Devin 开发商)的政府业务正快速增长至数十亿美元年收入规模,其自研模型可实现约 1000 token/s 的 Opus 级编码推理能力。
Ollama 上线通义千问 Qwen 3.5 全系列小模型(9B/4B/2B/0.8B),原生支持工具调用、思考模式和多模态能力,一键命令即可本地运行。
新研究提出通过奖励建模(Reward Modeling)改善 AI 图像生成模型对空间关系的理解与表达,提升生成图像的空间准确性。
Together AI 宣布品牌视觉全面升级,公司承诺继续助力 AI 原生开发者构建突破性产品,开放创新的核心定位不变。
在 MWC 巴塞罗那,Deutsche Telekom 基于 ElevenLabs 的 ElevenAgents 平台发布 Magenta AI 呼叫助手,将 AI 语音代理直接嵌入运营商网络基础设施,实现任意通话的实时智能化。
新论文提出 dLLM(Simple Diffusion Language Modeling),探索将扩散模型直接应用于语言生成任务的新路径。
新论文提出将 Mode Seeking 与 Mean Seeking 方法结合,显著提升长视频生成的速度与质量。
Supabase 正与相关机构协调解决部分印度用户的网络访问问题,目前谈判进展积极,解决后将第一时间公告。
Claude 宣布 Memory 功能现已对免费计划用户开放,同时优化了记忆导入体验,用户可随时导出已保存的记忆内容。
Ollama 现已支持 Qwen 3.5 系列小模型(0.8B/2B/4B/9B),所有模型均原生支持工具调用、思维推理和多模态能力,可直接通过 ollama run 命令使用。
Runway 展示 Nano Banana 2 + Gen-4.5 图生视频的时尚工作流:设计师手绘草图经 AI 处理,数分钟内即可生成完整营销活动素材,大幅压缩从概念到成片的周期。
Google DeepMind 推出 Nano Banana 2,主打让复杂视觉内容创作更快速、更便宜、更普及。该模型面向图像生成与编辑场景,配套前后对比效果图展示其实际能力。
Musk 为 Grok 的「based」定性做出解释:所谓 based,就是如实呈现和讲述真相,暗示 xAI 设计 Grok 不受政治正确约束,追求客观直白的输出风格。
阿里发布 Qwen3.5 小参数系列四款模型(0.8B/2B/4B/9B),基于 Qwen3.5 底座,原生多模态、改进架构并引入强化学习扩展。9B 已能媲美更大规模模型,4B 适合轻量 Agent,0.8B/2B 面向边缘设备,同步开放 Base 版本。
swyx 透露 AI Engineer 欧洲大会仍缺机械可解释性、生成式媒体和 OpenClaw 三个赛道的优秀演讲者,承诺为入选者承担全部差旅及住宿费用。
Kimi 为 OpenClaw 推出限时充值奖励活动,充值 100 美元返赠 20%,300 美元返赠 30%,1000 美元以上返赠 40%,活动截止 3 月 8 日。
Kimi 发布新涂鸦庆祝 Pink Floyd《The Dark Side of the Moon》专辑 53 周年,并透露 Kimi 公司正好成立于该专辑 50 周年纪念日。
Ollama 称赞 MiniMax 的开源权重模型 M2.5 已能处理过去只有 Opus 或 GPT 才能完成的 Agent 任务,标志着开源模型在智能体能力上的重要里程碑。
AI 编程领域观察:多数开发者实际上只是在用 AI 辅助「氛围编程」,却自认为在做系统化的 AI Agent 工程开发,二者差距不小。
Sam Altman 在社区互动中表示需要暂时处理其他事务,今晚将回来继续回答大家的问题。
Sam Altman 简短回应No,并提示对方更新应用程序,暗示某项功能已在最新版本中可用。
新论文 JavisDiT++ 提出统一建模与优化方法,实现音频与视频的联合生成,推进多模态生成技术。
Replit 发布 Replit x Alif 合作项目视频,展示该平台上的开发者构建者故事。
Musk 透露特斯拉 AI4 计算机以约 H100 四分之一的算力即可处理真实世界驾驶的复杂场景,并据此认为当前 AI 推理所需算力被高估。
Musk 表示电力输出是衡量工业产能的最佳代理指标。在 AI 数据中心用电需求激增的背景下,电力已成为 AI 基础设施扩张的关键瓶颈。
AI 博主宝玉分享对比图指出,OpenClaw 项目通过 Vibe Coding 已生成近百万行代码,如何维护这些 AI 生成的大规模代码库成为一大挑战。
vLLM-Omni v0.16.0 正式发布,合并 121 个 PR,来自约 60 位贡献者。基于上游 vLLM v0.16.0 重构,音频、语音、图像和视频推理管线性能显著提升。