人工智能行业最新动态
最新数据显示 NVIDIA Blackwell Ultra 在 Agentic AI 场景下性能提升最高 50 倍、成本降低 35 倍,云厂商正在大规模部署 GB300 NVL72 系统用于低延迟长上下文推理。
Karpathy 认为 LLM 改变了编程语言的约束条件,代码翻译(如 C 转 Rust、COBOL 迁移)趋势加速,因为原始代码库充当了高质量提示,翻译比从零生成更擅长。
数十台 G1 人形机器人完成全球首个全自主人形机器人集群功夫表演,H2 身穿齐天大圣重甲骑乘 B2W 四足机器狗翻筋斗云亮相北京主会场和义乌分会场。
祝贺通义千问发布 Qwen3.5,vLLM 已提供首日支持,支持 Gated Delta Networks + 稀疏 MoE 架构,397B 总参数仅 17B 激活。
通义千问团队感谢 SGLang 对 Qwen3.5 的支持。
Jeff Dean 播客表现很好,但 A/B 测试显示 Gemini 生成的缩略图比人工精心制作的点击率更高。
通义千问团队感谢 vLLM 项目对 Qwen3.5 的支持。
可通过 ollama run qwen3.5:cloud 命令使用 Qwen3.5 系列首个开权重模型。
Elon Musk 分享他刚从 xAI 工程会议结束回家。
虽然还有很长的路要走,但 Grok 4.20 开始能够正确回答开放式工程问题。
原生多模态,解码吞吐量提升 8.6-19 倍,支持 201 种语言方言,Apache 2.0 许可。
Anthropic 正式在印度班加罗尔开设办公室,这是其在亚太地区的第二个办公室,印度是 Claude.ai 第二大市场。
OpenAI Codex 的每周活跃用户数自 2026 年初以来增长超过三倍。
包括承认 AI 辅助创作、认真校对输出、精心编写 Prompt、让 AI 反复修改等使用规范。
海螺 AI(MiniMax)成为 2026 年世界 AI 电影节官方合作伙伴,全球巡回包括戛纳、圣保罗、京都、首尔、北京。
Peter Steinberger 将负责推动下一代个人智能体开发,OpenClaw 在 GitHub 获得超 18 万颗星。
提供 5000+ 社区技能库、40GB 云存储、专业级搜索及第三方 OpenClaw 接入功能。
Peter Steinberger 加入 OpenAI 推动下一代个人智能体开发,OpenClaw 将作为开源项目继续由 OpenAI 支持。
在伦敦 ElevenLabs 峰会上,因 ALS 几乎完全丧失发声能力的 Patrick Darling 借助 AI 重建的歌声在近千人面前现场演唱,歌声基于确诊前的录音生成。
Altman 指出 AI 系统已从难以完成小学数学进化到能解决研究级数学问题,并强调 AI 产生全新知识的能力是一个值得认真对待的里程碑,需同时保持兴奋和谨慎。
Musk 回应关于 Grok AI 宪法(Constitution)的讨论,拒绝部分外部人士参与编写 Grok 的价值准则,引发社区关于 AI 对齐方向的热议。
vLLM 将于 3 月 7 日在香港举办全天 Meetup,主题涵盖 LLM 推理、多模态服务和多硬件优化。vLLM 核心团队、Red Hat AI、AMD AI、MetaX 和 MiniMax 等将参与演讲和 Workshop。
SkyRL 发布 Tinker 框架,将强化学习训练带到本地 GPU。通过标准化训练 API 降低研究和基础设施创新门槛,vLLM 为其提供高吞吐推理层支持。
豆包大模型 2.0 正式发布,重点优化大规模生产环境下的实际使用需求。官方展示了基于 OpenClaw 框架在飞书上构建的智能客服 Agent,可完成调用技能、拉群协作、预约维修、主动回访等完整业务闭环。
有人用 Seedance 2.0 将经典星球大战梗图制作成 AI 视频,讽刺科技公司以治愈癌症为名消耗大量算力,实际产出却是擦边内容。宝玉详细解读了这个梗的笑点和深意。
swyx 表示过去三年对开源 AI 持谨慎态度,但 DeepSeek V4 可能是他首次真正改变立场的时刻。他提到 Kimi K2.5 最终未能超越 GPT-5.2,但中国实验室之间信息流通迅速,竞争激烈。
Sam Altman 在 Stanford 黑客松上分享了 OpenAI 创立首日的故事,表示当前大二学生毕业时将面对一个拥有 AGI 的世界,并讨论了创业者应该关注的方向。
A list of free LLM inference resources accessible via API.
Official code repo for the O'Reilly Book - "Hands-On Large Language Models"
In-depth tutorials on LLMs, RAGs and real-world AI agent applications.