人工智能行业最新动态
新论文探讨如何通过数据工程手段提升大语言模型在终端/命令行场景下的能力,为 AI Coding Agent 的训练数据构建提供方法论。
MiniMax 海螺 AI 将在 2 月 28 日巴西 WAIFF 电影节上发表主题演讲并举办工作坊,同时设立 MiniMax 长片电影奖。
ElevenLabs 的 AI 语音 Agent 帮助 tinmanAI 在 2025 年自动化处理 189 万通抵押贷款电话,35% 无需人工介入,贷款转化率提升 2 倍,每月节省 1600 小时人力。
为 Spotify/Apple Music 提供歌词服务的 Musixmatch 使用 Replit,让设计师和 PM 自主开发,两个月从概念到上线,已售出 1000+ 件 T 恤并开辟新营收。
宝玉分析 Agent Skills 爆发原因:模型能力到位加上 Agent 工具链成熟,能力从编程泛化到非编程任务,从技术圈扩展到非技术圈。
LAP(Language-Action Pre-Training)通过语言与动作的联合预训练,实现机器人在不同机体间的零样本策略迁移,无需针对新硬件重新训练。
新论文揭示 Test-Time Training 中的 KV Binding 机制与线性注意力之间的等价关系,为理解和改进推理时自适应提供新视角。
Karpathy 回复讨论称,Agent 能力已到位,UI 也在改善,核心挑战在于如何将开发者脑中的知识和上下文系统化、可测试、可观察,让 Agent 能独立跑更长的循环。
新研究 EgoScale 提出利用多样化自我中心人类数据来扩展灵巧操控能力,为机器人精细操作提供新思路。
n8n 发布股票分析自动化模板,可自动拉取每日价格数据、分析趋势并生成买卖信号,结果保存至 Google Sheets。
v0 新增与 PostHog 产品分析平台的数据对接功能,开发者可基于产品洞察进行迭代构建。
Runway 平台集成 Kling 3.0 多镜头功能,用户可一键创建时尚造型视频。
Replit 发布新的 Agent 模式分档:Lite(小编辑)、Economy(降价 66%)、Power(标准性能)和 Turbo(最强性能,仅 Pro+ 用户可用)。
新研究 SimToolReal 提出以物体为中心的策略,实现零样本灵巧工具操控,推动机器人工具使用能力进步。
Together AI 开源 CoderForge-Preview 数据集,包含 25.8 万条测试验证的编码代理轨迹。微调 Qwen3-32B 后 SWE-bench 通过率从 23% 飙升至 59.4%,32B 以下开放数据模型中排名第一。
Karpathy 认为将 AI 编程用户称为「提示者」是一种误解,顶级开发者的深度技术专长在 AI 工具加持下可能比以往更具乘数效应。
Claude 推出 Cowork 功能研究预览版,支持 macOS 和 Windows 平台,所有付费用户均可使用。
Anthropic 桌面工具 Cowork 新增定时任务、插件系统和自定义面板,正从即时助手转型为自动化工具,支持每日简报、每周更新等重复性工作。
vLLM 稳定版首日支持 Liquid AI 的 LFM2-24B-A2B 模型,总参数 240 亿但每 token 仅激活 20 亿,可在 32GB 内存运行,H100 上达 293 tok/s。
Eigent 与 Qwen3.5-Plus 合作实现「视频转游戏」功能,可将视频内容转化为可交互的游戏体验。
Google 增强 Circle to Search 功能,现可同时识别图片中的多个对象,适用于情绪板策划、搭配穿搭等多层次搜索场景。
宝玉分析 Cloudflare 团队用 AI 一周实现 Next.js on Vite 的四大条件:完善的文档训练数据、端到端测试做验收标准、Vite 底层能力、以及模型上下文能力的突破。
Replit 发布面向高级用户的 Pro 套餐($100/月),同时 Core 套餐降至 $20/月并新增 Economy 模式,比现有价格低 66%。
Qwen3.5 Medium 模型获 GGUF 格式支持,由 UnslothAI 团队快速适配完成,方便用户在各类本地推理框架中使用。
Qwen3.5-35B-A3B 模型现已在 LM Studio 上线,用户可直接下载使用该 MoE 模型进行本地推理。
Google DeepMind 发布 Project Genie 研究团队访谈,探讨单一提示词如何生成可导航环境,以及世界模型在训练未来 AI 智能体方面的潜力。
Ollama 现已支持 Qwen 3.5 Medium 模型系列,用户可通过 Ollama 本地部署运行通义千问最新模型。
Perplexity Computer 可同时管理数百个活跃项目,帮助用户清理待办、推进项目或启动新的副业。官方提供了精选任务直播页面。
Perplexity Computer 采用按用量计费,用户可为不同子任务选择不同模型并设定消费上限。Max 用户每月获 1 万积分,现有用户额外赠送 2 万积分。
Google 在三星 Galaxy Unpacked 上展示 S26 系列 AI 功能:Gemini 可在后台自动完成多步骤任务(如建购物车、叫车),Circle to Search 也获得增强。