全部 今日 本周 本月
2026-02-16

NVIDIA:Blackwell Ultra 在 Agentic AI 推理上性能提升 50 倍

最新数据显示 NVIDIA Blackwell Ultra 在 Agentic AI 场景下性能提升最高 50 倍、成本降低 35 倍,云厂商正在大规模部署 GB300 NVL72 系统用于低延迟长上下文推理。

芯片
@nvidia 阅读 →

Andrej Karpathy:LLM 正在重塑编程语言格局

Karpathy 认为 LLM 改变了编程语言的约束条件,代码翻译(如 C 转 Rust、COBOL 迁移)趋势加速,因为原始代码库充当了高质量提示,翻译比从零生成更擅长。

观点
@karpathy 阅读 →

宇树科技:春晚机器人表演全部细节公开

数十台 G1 人形机器人完成全球首个全自主人形机器人集群功夫表演,H2 身穿齐天大圣重甲骑乘 B2W 四足机器狗翻筋斗云亮相北京主会场和义乌分会场。

机器人
@UnitreeRobotics 阅读 →

vLLM:Qwen3.5 首日支持已就绪

祝贺通义千问发布 Qwen3.5,vLLM 已提供首日支持,支持 Gated Delta Networks + 稀疏 MoE 架构,397B 总参数仅 17B 激活。

芯片
@vllm_project 阅读 →

通义千问:感谢 SGLang 的支持

通义千问团队感谢 SGLang 对 Qwen3.5 的支持。

行业
@Alibaba_Qwen 阅读 →

swyx:YouTube 测试显示 AI 生成缩略图比人工更受欢迎

Jeff Dean 播客表现很好,但 A/B 测试显示 Gemini 生成的缩略图比人工精心制作的点击率更高。

大模型
@swyx 阅读 →

通义千问:感谢 vLLM 的支持

通义千问团队感谢 vLLM 项目对 Qwen3.5 的支持。

大模型
@Alibaba_Qwen 阅读 →

Ollama:Qwen3.5-397B-A17B 现已在 Ollama 云上线

可通过 ollama run qwen3.5:cloud 命令使用 Qwen3.5 系列首个开权重模型。

产品发布
@ollama 阅读 →

Elon Musk:刚从 xAI 工程会议回家

Elon Musk 分享他刚从 xAI 工程会议结束回家。

行业
@elonmusk 阅读 →

Elon Musk:Grok 4.20 开始能正确回答开放式工程问题

虽然还有很长的路要走,但 Grok 4.20 开始能够正确回答开放式工程问题。

观点
@elonmusk 阅读 →

通义千问:Qwen3.5-397B-A17B 发布,首个开权重模型

原生多模态,解码吞吐量提升 8.6-19 倍,支持 201 种语言方言,Apache 2.0 许可。

大模型
@Alibaba_Qwen 阅读 →

Anthropic:在印度班加罗尔开设办公室

Anthropic 正式在印度班加罗尔开设办公室,这是其在亚太地区的第二个办公室,印度是 Claude.ai 第二大市场。

产品发布
@AnthropicAI 阅读 →

Sam Altman:Codex 每周活跃用户自年初增长超 3 倍

OpenAI Codex 的每周活跃用户数自 2026 年初以来增长超过三倍。

行业
@sama 阅读 →
2026-02-14

ElevenLabs:AI 重建 ALS 患者歌声,在千人峰会上现场演唱

在伦敦 ElevenLabs 峰会上,因 ALS 几乎完全丧失发声能力的 Patrick Darling 借助 AI 重建的歌声在近千人面前现场演唱,歌声基于确诊前的录音生成。

产品发布
@elevenlabsio 阅读 →

Sam Altman:AI 数学能力飞速进步,能产生全新知识是重要里程碑

Altman 指出 AI 系统已从难以完成小学数学进化到能解决研究级数学问题,并强调 AI 产生全新知识的能力是一个值得认真对待的里程碑,需同时保持兴奋和谨慎。

观点
@sama 阅读 →

Elon Musk 回应 Grok 宪法争议:不应由伪善者起草

Musk 回应关于 Grok AI 宪法(Constitution)的讨论,拒绝部分外部人士参与编写 Grok 的价值准则,引发社区关于 AI 对齐方向的热议。

大模型
@elonmusk 阅读 →

vLLM:3 月 7 日香港举办 LLM 推理专题 Meetup

vLLM 将于 3 月 7 日在香港举办全天 Meetup,主题涵盖 LLM 推理、多模态服务和多硬件优化。vLLM 核心团队、Red Hat AI、AMD AI、MetaX 和 MiniMax 等将参与演讲和 Workshop。

活动
@vllm_project 阅读 →

vLLM:SkyRL 开源 Tinker 框架,在本地 GPU 上实现高效 RL 训练

SkyRL 发布 Tinker 框架,将强化学习训练带到本地 GPU。通过标准化训练 API 降低研究和基础设施创新门槛,vLLM 为其提供高吞吐推理层支持。

研究
@vllm_project 阅读 →

字节跳动:豆包大模型 2.0 发布,聚焦真实世界复杂任务

豆包大模型 2.0 正式发布,重点优化大规模生产环境下的实际使用需求。官方展示了基于 OpenClaw 框架在飞书上构建的智能客服 Agent,可完成调用技能、拉群协作、预约维修、主动回访等完整业务闭环。

产品发布
@dotey 阅读 →

宝玉:Seedance 2.0 生成的梗视频讽刺 AI 行业——算力都用在哪了?

有人用 Seedance 2.0 将经典星球大战梗图制作成 AI 视频,讽刺科技公司以治愈癌症为名消耗大量算力,实际产出却是擦边内容。宝玉详细解读了这个梗的笑点和深意。

行业
@dotey 阅读 →

swyx:DeepSeek V4 或下周发布,开源 AI 格局可能迎来真正转折

swyx 表示过去三年对开源 AI 持谨慎态度,但 DeepSeek V4 可能是他首次真正改变立场的时刻。他提到 Kimi K2.5 最终未能超越 GPT-5.2,但中国实验室之间信息流通迅速,竞争激烈。

观点
@swyx 阅读 →

swyx:Sam Altman 在 Stanford 黑客松发言——大二学生毕业时将迎来 AGI 世界

Sam Altman 在 Stanford 黑客松上分享了 OpenAI 创立首日的故事,表示当前大二学生毕业时将面对一个拥有 AGI 的世界,并讨论了创业者应该关注的方向。

观点
@swyx 阅读 →

TelegramMessenger/MTProxy (+35 stars today)

A list of free LLM inference resources accessible via API.

开源
GitHub Trending 阅读 →

google-deepmind/superhuman (+49 stars today)

Official code repo for the O'Reilly Book - "Hands-On Large Language Models"

开源
GitHub Trending 阅读 →

patchy631/ai-engineering-hub (+84 stars today)

In-depth tutorials on LLMs, RAGs and real-world AI agent applications.

开源
GitHub Trending 阅读 →