人工智能行业最新动态
NVIDIA 的 Andrea Weidlich 和 Luca Fascione 因在 Weta FX 的分层材质系统工作获 2026 奥斯卡技术成就奖,推动了计算机图形学的真实感材质建模。
Replit Animation 接入 Gemini 3.1 Pro 模型,显著提升 SVG 动画生成质量。Replit Agent 现已支持自动生成动画,并附演示视频。
Midjourney 为 Niji V7 添加 Moodboards 和 Personalization 功能,同时大幅改进个性化 Web 界面。旧版 Web Rooms 将下线,为下一代协作工具让路。
Ollama 发布 Pi,一个可通过 ollama launch pi 启动的极简编程 Agent,支持用户自定义工作流,甚至可以让 Pi 为自己编写扩展插件。
Perplexity 成为首个获得三星系统级 OS 访问权限的第三方应用,Galaxy 用户可在设备上选择多个 AI 助手,不再被锁定于单一助手。
Google 官方展示 Nano Banana 2 生成的信息图,搭配 Gemini 推理能力。这是 Gemini 3.1 Flash Image Preview,主打高效低成本图像生成。
Anthropic CEO Dario Amodei 就公司与美国国防部的讨论发表正式声明,引发广泛关注。
Boston Dynamics 产品经理分享 Sandflea 和 BigDog 等经典机器人如何激励团队解决真实世界机器人技术的下一个挑战。
Replicate 平台上线 Nano Banana 2 模型,支持文字渲染、逼真输出和内置图像编辑,速度提升 4 倍且成本更低。
Perplexity 推出 pplx-embed-v1 和 pplx-embed-context-v1 两个 SOTA 嵌入模型 API,专为真实世界大规模网络检索场景设计。
Cursor 发布 Bugbot Autofix 功能,可在 Pull Request 中自动检测并修复代码问题。
Google 分享 Nano Banana 2 实际演示,展示其工作室级创意控制和基于真实世界推理的图像生成编辑能力。
Altman 称赞 Greg Brockman 多次展现出在困难时刻捍卫 OpenAI 使命和团队的坚定信念。
Altman 表示 OpenAI 正在寻找来自非传统背景(尤其是前创始人)的优秀招聘人员,认为最好的研究团队需要具备品味和对领域方向的判断力。
Google 正式推出 Nano Banana 2 图像生成模型,兼具 Pro 级质量和 Flash 级速度,已在 Gemini App、搜索及开发者工具中上线。
Claude 宣布 Connectors 功能在免费计划中可用,提供 150 多个涵盖编码、数据、设计、金融、销售等领域的连接器。
Nano Banana 2 基于最新 Gemini Flash 模型构建,具备 Pro 级图像创建和编辑能力,同时拥有极快的生成速度。
Perplexity 宣布与三星达成合作,即将发布的 Galaxy S26 将内置 Perplexity 作为系统级 AI,支持语音唤醒词 Hey Plex。
马斯克表示 xAI 的 Grok 4.20 模型在工程领域的表现正在显著提升。
AI 音乐生成评测平台 Music Arena 新增 Google Lyria 3、ElevenLabs Music v1 等模型,用户可免费试用并对比各模型生成效果。
MiniMax 旗下海螺 AI 上线 Seedream 5.0 Lite 图像模型,支持精准编辑、最多 14 张参考图锁定一致性、图文联合推理,会员可无限使用。
Runway 宣布新一轮高管任命,持续加码世界模拟(World Simulation)方向的研发投入。
PrunaAI 的 P-video 模型上线 Replicate,10 秒内生成带原生音频的视频,成本仅 10 美分。上线首 24 小时免费使用。
德国总理默茨及代表团参观宇树科技,对宇树机器人表现出浓厚兴趣。宇树表示期待与全球更多优秀企业合作,共同推进智能机器人技术发展。
vLLM 团队回应 Karpathy 推荐,表示正在让 vLLM 兼具易用性和高性能,为开发者和 AI 代理提供简单、快速、低成本的 LLM 部署方案。
swyx 分享 Cursor Agent 云端版实测,仅输入一条推文中的视频,Agent 自主工作 43 分钟后成功还原完整网站,展现惊人的自主编码能力。
阿里通义千问宣布 Qwen3.5 发布当天即可通过 MLX-VLM 在 Apple Silicon 设备上运行。
Kimi 与 MIT EECS 和 NLP 实验室合作,学生将利用 Kimi K2.5 的多模态能力完成 2026 春季学期研究项目。
Ollama 为 OpenClaw 添加视觉功能,支持查看图片、读取截图和提取照片细节,可通过 Kimi K2.5 云端模型使用。