人工智能行业最新动态
v0 产品负责人将于周三中午(PT)举办直播,演示如何使用 v0 构建 AI Agent、连接代码仓库并部署到现有代码库中。
LMSys 发布 SGLang Cookbook 教程,涵盖从基础配置到推理解析和工具调用的完整流程,以 Qwen3-30B-A3B 为演示模型,支持一键部署到任意硬件。
最新研究提出 SkillsBench 基准测试,用于系统评估 AI Agent 技能在多样化任务上的表现,填补了 Agent 能力评估领域的空白。
Recraft V4 在 Replicate 上线,支持最长 10000 字符的提示词实现极致创意精度,V4 SVG 版本可生成完全可编辑的矢量图形,可直接导入 Illustrator 或 Figma。
宝玉指出 Claude Agent SDK 已不能使用 Claude Code 的 OAuth 登录,对 Anthropic 此举表示遗憾。
Replit 宣布与 Databricks 深度集成,企业团队可通过 Vibe Code 方式在 Databricks 平台上快速构建和部署应用,同时保留治理、安全和可观测性。
Supabase 发布了结合 MCP-use 构建 ChatGPT 应用的完整教程,帮助开发者快速搭建基于大模型的数据驱动应用。
Meta AI 宣布首席 AI 官 Alexandr Wang 将在印度 AI 影响力峰会发表演讲,时间为 2 月 19 日,可通过直播观看。
Runway 展示其预可视化能力,可将故事板和草图在几分钟内转化为高保真预览画面,大幅缩短传统影视制作中需要数月的前期预览流程。
Replicate 发布新技能标准,可教 AI Agent 查找、对比和运行 AI 模型。遵循 Agents Skills 标准,兼容 Claude Code、OpenCode、Codex、Pi 等主流平台,一行命令即可安装。
最新研究论文 AnchorWeave 提出通过检索局部空间记忆来实现视频生成中的世界一致性,解决生成视频在场景切换时的空间连贯性问题。
宝玉认为借助 AI Agent 操作 Git 的成本几乎为零,完全不需要记忆繁琐命令。但提醒注意 GitHub Repo 权限,避免误将私有项目设为公开。
Google 在 Gemini 应用中上线 AI 音乐生成功能,基于 DeepMind 最新 Lyria 3 模型。用户可通过文字描述、照片或视频生成 30 秒完整音轨(含人声和歌词),面向全球 18 岁以上用户开放 Beta。
Latent Space 主理人 swyx 分享了他珍藏的经典梗图,每当有新一轮"加拿大女友式"表演型程序员出现在时间线上时就会拿出来。推文获超 1300 赞,引发广泛共鸣。
Google DeepMind 宣布与印度政府机构和科研院所合作,通过培训、辅导学生和建设创新中心,推动 AI 在科学发现和教育领域的实际应用。
ST Engineering MRAS 利用 Boston Dynamics 的 Spot 机器人自主采集设备健康数据,结合 Leica BLK ARC 生成精确点云用于数字孪生。
Google 正式发布 Pixel 10a,定价 499 美元,配备先进 AI 工具和同价位最佳相机系统,采用全平面耐用设计,续航更持久。
阿里通义千问 Qwen 3.5 Plus 模型已在 Vercel AI Gateway 上线,开发者可直接通过 model: 'alibaba/qwen3.5-plus' 调用。
ElevenLabs 获得 AIUC-1 认证,成为首家为 AI 语音代理及其行为投保的公司,标志着 AI 代理商业化进入保险保障新阶段。
Replicate 宣布 Runway Gen-4.5 上线,支持多种美学风格的电影级视频生成,物理准确性和真实感达到前所未有的水平。
宝玉分享了使用 Claude Code 的 Hook 和 Skill 机制,在每次任务结束后自动执行 Git 提交的实践方案,让 AI 写作流程中的版本管理完全自动化。
Google DeepMind 推出迄今最强音乐生成模型 Lyria 3,支持清晰音频和精细控制,已在 Gemini 应用中以 Beta 形式上线。用户可通过文字描述或上传图片/视频生成 30 秒完整音轨。
Anthropic 发布报告指出,软件工程占其 API 上 Agent 工具调用的约 50%,但已观察到在其他行业的新兴应用。随着风险与自主性边界的扩展,部署后监控变得至关重要。
Google 扩展内容验证工具,用户可将音频文件上传至 Gemini,检测是否包含 SynthID 隐形水印,判断是否为 AI 生成内容。
Claude 推出 Figma MCP 服务器插件,用户可直接让 Claude 将本地网页应用的页面发送到 Figma 进行设计协作。
Qwen3.5-397B-A17B-FP8 模型权重已开源,SGLang 支持已合并,vLLM 支持即将到来,可在 Hugging Face 和 ModelScope 下载。
阿里云模型服务平台推出 Qwen Coding Plan,提供最新 Qwen3.5-Plus 模型,支持 Claude Code、Cursor 等工具,Lite 版月费约 10 美元起,首发五折优惠。
Cursor 现已支持将过去的对话内容作为上下文使用,提升代码编辑的连续性和效率。
DeepMind 发布 Lyria 3 详细介绍,该模型可将照片和文字转化为包含人声和歌词的动态音乐曲目,为目前最强生成式音乐模型。
Anthropic 分析了 Claude Code 和 API 的数百万次交互,研究人们赋予 AI 智能体多少自主权、部署场景及潜在风险。