人工智能行业最新动态
vLLM 团队回应 Karpathy 推荐,表示正在让 vLLM 兼具易用性和高性能,为开发者和 AI 代理提供简单、快速、低成本的 LLM 部署方案。
swyx 分享 Cursor Agent 云端版实测,仅输入一条推文中的视频,Agent 自主工作 43 分钟后成功还原完整网站,展现惊人的自主编码能力。
阿里通义千问宣布 Qwen3.5 发布当天即可通过 MLX-VLM 在 Apple Silicon 设备上运行。
Kimi 与 MIT EECS 和 NLP 实验室合作,学生将利用 Kimi K2.5 的多模态能力完成 2026 春季学期研究项目。
Ollama 为 OpenClaw 添加视觉功能,支持查看图片、读取截图和提取照片细节,可通过 Kimi K2.5 云端模型使用。
新论文提出 Xray-Visual Models,探索在工业规模数据集上训练视觉模型的方法,推动视觉理解能力的大规模扩展。
新论文探讨如何通过数据工程手段提升大语言模型在终端/命令行场景下的能力,为 AI Coding Agent 的训练数据构建提供方法论。
MiniMax 海螺 AI 将在 2 月 28 日巴西 WAIFF 电影节上发表主题演讲并举办工作坊,同时设立 MiniMax 长片电影奖。
ElevenLabs 的 AI 语音 Agent 帮助 tinmanAI 在 2025 年自动化处理 189 万通抵押贷款电话,35% 无需人工介入,贷款转化率提升 2 倍,每月节省 1600 小时人力。
为 Spotify/Apple Music 提供歌词服务的 Musixmatch 使用 Replit,让设计师和 PM 自主开发,两个月从概念到上线,已售出 1000+ 件 T 恤并开辟新营收。
宝玉分析 Agent Skills 爆发原因:模型能力到位加上 Agent 工具链成熟,能力从编程泛化到非编程任务,从技术圈扩展到非技术圈。
LAP(Language-Action Pre-Training)通过语言与动作的联合预训练,实现机器人在不同机体间的零样本策略迁移,无需针对新硬件重新训练。
新论文揭示 Test-Time Training 中的 KV Binding 机制与线性注意力之间的等价关系,为理解和改进推理时自适应提供新视角。
Karpathy 回复讨论称,Agent 能力已到位,UI 也在改善,核心挑战在于如何将开发者脑中的知识和上下文系统化、可测试、可观察,让 Agent 能独立跑更长的循环。
新研究 EgoScale 提出利用多样化自我中心人类数据来扩展灵巧操控能力,为机器人精细操作提供新思路。
n8n 发布股票分析自动化模板,可自动拉取每日价格数据、分析趋势并生成买卖信号,结果保存至 Google Sheets。
v0 新增与 PostHog 产品分析平台的数据对接功能,开发者可基于产品洞察进行迭代构建。
Runway 平台集成 Kling 3.0 多镜头功能,用户可一键创建时尚造型视频。
Replit 发布新的 Agent 模式分档:Lite(小编辑)、Economy(降价 66%)、Power(标准性能)和 Turbo(最强性能,仅 Pro+ 用户可用)。
新研究 SimToolReal 提出以物体为中心的策略,实现零样本灵巧工具操控,推动机器人工具使用能力进步。
Together AI 开源 CoderForge-Preview 数据集,包含 25.8 万条测试验证的编码代理轨迹。微调 Qwen3-32B 后 SWE-bench 通过率从 23% 飙升至 59.4%,32B 以下开放数据模型中排名第一。
Karpathy 认为将 AI 编程用户称为「提示者」是一种误解,顶级开发者的深度技术专长在 AI 工具加持下可能比以往更具乘数效应。
Claude 推出 Cowork 功能研究预览版,支持 macOS 和 Windows 平台,所有付费用户均可使用。
Anthropic 桌面工具 Cowork 新增定时任务、插件系统和自定义面板,正从即时助手转型为自动化工具,支持每日简报、每周更新等重复性工作。
vLLM 稳定版首日支持 Liquid AI 的 LFM2-24B-A2B 模型,总参数 240 亿但每 token 仅激活 20 亿,可在 32GB 内存运行,H100 上达 293 tok/s。
Eigent 与 Qwen3.5-Plus 合作实现「视频转游戏」功能,可将视频内容转化为可交互的游戏体验。
Google 增强 Circle to Search 功能,现可同时识别图片中的多个对象,适用于情绪板策划、搭配穿搭等多层次搜索场景。
宝玉分析 Cloudflare 团队用 AI 一周实现 Next.js on Vite 的四大条件:完善的文档训练数据、端到端测试做验收标准、Vite 底层能力、以及模型上下文能力的突破。
Replit 发布面向高级用户的 Pro 套餐($100/月),同时 Core 套餐降至 $20/月并新增 Economy 模式,比现有价格低 66%。
Qwen3.5 Medium 模型获 GGUF 格式支持,由 UnslothAI 团队快速适配完成,方便用户在各类本地推理框架中使用。