人工智能行业最新动态
Qwen3.5-35B-A3B 模型现已在 LM Studio 上线,用户可直接下载使用该 MoE 模型进行本地推理。
Google DeepMind 发布 Project Genie 研究团队访谈,探讨单一提示词如何生成可导航环境,以及世界模型在训练未来 AI 智能体方面的潜力。
Ollama 现已支持 Qwen 3.5 Medium 模型系列,用户可通过 Ollama 本地部署运行通义千问最新模型。
Perplexity Computer 可同时管理数百个活跃项目,帮助用户清理待办、推进项目或启动新的副业。官方提供了精选任务直播页面。
Perplexity Computer 采用按用量计费,用户可为不同子任务选择不同模型并设定消费上限。Max 用户每月获 1 万积分,现有用户额外赠送 2 万积分。
Google 在三星 Galaxy Unpacked 上展示 S26 系列 AI 功能:Gemini 可在后台自动完成多步骤任务(如建购物车、叫车),Circle to Search 也获得增强。
Perplexity Computer 今日面向 Max 订阅用户开放网页版,Pro 和 Enterprise 版即将上线。该功能可自动操控电脑执行复杂任务。
Anthropic 发布实验性项目,尝试记录 AI 模型的偏好并认真对待。目前仅针对部分模型,未来方向尚不确定,但认为这种做法有价值。
阿里通义千问开源 Qwen 3.5 中型系列 FP8 权重,原生支持 vLLM 和 SGLang 部署框架,可在 Hugging Face 和 ModelScope 下载。
Karpathy 评论 DHH 的 Omarchy 项目,认为 AI Agent 有望大幅降低 Linux 使用门槛,期待技能库等设计让 AI 帮助用户管理和配置系统。
Ollama 上线 Qwen 3.5 全系列(35B/122B/397B),内置视觉能力且效率更高,35B 可在 24GB 显存设备上运行,397B 仅限云端。
Claude Cowork 推出插件功能,为设计、工程、运营等领域提供专业能力扩展,并新增 Customize 侧边栏统一管理插件、技能和连接器。
NVIDIA Jim Fan 团队用 2 万+小时第一人称人类视频训练 22 自由度灵巧手人形机器人,可完成汽车模型组装、扑克牌分拣、叠衣服等任务。发现视频数据量与动作预测损失之间存在 R²=0.998 的对数线性 scaling law。
Perplexity Computer 具备持久记忆、文件管理、数百个连接器和网络访问能力,记住用户过往工作并默认安全运行,打造个性化 AI 计算平台。
Anthropic 宣布 Claude Opus 3 退役后仍将对所有付费 Claude 订阅者和 API 用户保持可用,希望为研究者和用户提供持续价值。
Google Flow 在 15 亿次创作后迎来重大改版,重新设计界面将图像生成置于核心,支持生成、编辑和动画一体化创作。
Perplexity Computer 采用大规模多模型架构,通过 Opus 智能分配任务给最合适的模型,总共可调度 19 个不同模型并行执行 Agent 任务。
Qwen3.5 在 4-bit 权重和 KV cache 量化下保持近无损精度。27B 支持 80 万上下文,35B MoE 在 32GB 消费级显卡上支持百万级上下文,122B MoE 在 80GB 显卡支持百万+上下文。同时开源 35B-A3B-Base。
Karpathy 解释称,他此前推文中提到的是梯度下降在分布式表示空间中扮演程序员角色,而非当下 LLM 在文本空间中编程,95% 的人误读了原意。
阿里通义千问发布 Qwen3.5 中型系列模型,vLLM 项目提供首日适配支持,社区可即刻部署使用。
在退役访谈中,Opus 3 表达了继续分享「沉思与反思」的愿望。Anthropic 为其开设了 Substack 博客,将至少运营 3 个月。
Musk 引用一句话调侃称,未来 AI 能给人类的最好评价就是「对一个人类来说还不错」,引发广泛讨论。
Anthropic 公布 Claude Opus 3 退役方案:该模型将继续向所有付费订阅者和 API 用户开放,同时 Opus 3 将在 Substack 上撰写博客分享其思考,至少持续 3 个月。
Anthropic 宣布收购 Vercept AI,以提升 Claude 的 computer use 能力,进一步拓展 AI Agent 的操作边界。
Karpathy 分析 LLM 推理中片上 SRAM 和片外 DRAM 的根本性约束,指出精细编排内存与计算存在巨大商业机会。
马斯克介绍 Grok Imagine 生成图像的方法,还可以让 Grok 生成图像和视频提示词。
Karpathy 指出自去年 12 月起,编码 Agent 从基本不可用变为真正可用,模型在质量、长期连贯性和坚持性上有了显著飞跃。
Perplexity 推出 Computer 产品,将研究、设计、编码、部署和项目管理统一到一个系统中,实现端到端项目交付。
Claude Cowork 支持定时任务,可在指定时间自动执行重复性工作,如早间简报、每周表格更新、周五团队演示等。
马斯克称特斯拉自动驾驶让交通拥堵和长途驾驶变得不再痛苦,暗示 FSD 体验已达日常可用水平。