全部 今日 本周 本月
2026-02-12

Andrej Karpathy:天使投资 Simile AI,探索 LLM 多人格模拟

Karpathy 宣布作为天使投资人参与 Simile AI。该公司探索 LLM 的「模拟引擎」本质——预训练模型天然具备模拟互联网上多元人群的能力,为何只模拟单一人格?

产品发布
@karpathy 阅读 →

Andrej Karpathy:micrograd 代码精简 18%,仅 200 行

Karpathy 进一步简化 micrograd 项目,通过让每个算子仅返回局部梯度、由 backward() 负责链式乘法,代码从 243 行精简到 200 行(减少 18%),代码更优雅地排列为 3 列。

行业
@karpathy 阅读 →

Google DeepMind:Gemini 3 Deep Think 升级,ARC-AGI-2 达 84.6%

Google DeepMind 升级 Gemini 3 Deep Think 推理模式,ARC-AGI-2 达 84.6%(SOTA),Humanity's Last Exam 创新标准,Codeforces Elo 达 3455。展示 Duke 大学用其设计半导体新材料。

研究
@GoogleDeepMind 阅读 →

Sam Altman:GPT-5.3-Codex-Spark 推理速度超 1000 tokens/秒

Sam Altman 宣布 GPT-5.3-Codex-Spark 以研究预览形式面向 Pro 用户发布,推理速度超过每秒 1000 tokens,发布初期存在一些限制,后续将快速迭代改进。

产品发布
@sama 阅读 →

OpenAI:发布 GPT-5.3-Codex-Spark 研究预览版

OpenAI 推出 GPT-5.3-Codex-Spark 研究预览版,推理速度超 1000 tokens/秒,面向 Pro 用户开放,支持 ChatGPT Pro 的 Codex 应用、CLI 和 IDE 插件。

产品发布
@OpenAI 阅读 →

Anthropic:以 3800 亿美元估值完成 300 亿美元融资

Anthropic 宣布完成 300 亿美元融资,投后估值 3800 亿美元。年化营收已达 140 亿美元,过去三年每年增长超 10 倍,已成为企业和开发者首选的智能平台。

企业动态
@AnthropicAI 阅读 →

宝玉:更新 X 推文下载 Skill,支持图片和视频下载

宝玉更新了 baoyu-danger-x-to-markdown Skill,现在可以将 X 推文(含 Thread、文章)下载为 Markdown,并支持图片和视频本地下载。提醒使用小号操作。

行业
@dotey 阅读 →

Ollama:GLM-5 云端服务扩容提速

Ollama 宣布 GLM-5 云端模型已扩容并提升速度,完整尺寸模型可直接使用,支持 Claude Code 和 OpenClaw 等工具调用。

产品发布
@ollama 阅读 →

Anthropic:出资 2000 万美元成立 AI 政策倡导组织 Public First Action

Anthropic 宣布向 Public First Action 捐赠 2000 万美元,这是一个跨党派组织,旨在动员民众和政客关注 AI 政策制定。Anthropic 强调 AI 被采用的速度前所未有,政策窗口正在关闭。

企业动态
@AnthropicAI 阅读 →

Andrej Karpathy:整理 AI 学习资源为单页站点

Karpathy 将此前 Gist 上的 AI 学习资源整理为独立网页,方便一页浏览。

行业
@karpathy 阅读 →

Cursor:提升 Composer 1.5 使用限额,个人用户限时 6 倍

Cursor 宣布提升所有个人计划的 Auto 和 Composer 1.5 使用额度,Composer 1.5 用量为 Composer 1 的 3 倍,限时(至 2 月 16 日)提升至 6 倍。

企业动态
@cursor_ai 阅读 →
2026-02-11

Cursor Arena 排行榜出炉:Gemini 3 Flash 击败 Pro,用户更看重速度

Cursor Arena Mode 首周获 4 万票。主要发现:Gemini 3 Flash 击败 Pro、Grok Code Fast 击败 Gemini 3、Claude Haiku 4.5 击败 GPT 5.2、SWE 1.5 击败 Claude Haiku。结论:用户更看重速度。

大模型
@swyx 阅读 →

Vercel:Sandbox 支持网络出口策略,防止 Agent 数据泄露

Vercel Sandbox 新增出口策略配置功能,可控制 AI Agent 的网络流量,防止数据外泄,提升安全性。

产品发布
@vercel 阅读 →

Ming-flash-omni-2.0 多模态模型发布

Ming-flash-omni-2.0 模型已在 Hugging Face 上线,支持多模态能力。

大模型
@_akhaliq 阅读 →

LMSys:确认 Pony Alpha 即 GLM-5,SGLang 首日支持

LMSys 确认 OpenRouter 上神秘的 Pony Alpha 模型就是智谱 GLM-5(744B 参数/40B 活跃),SGLang 首日提供推理支持。模型集成 DeepSeek Sparse Attention 和 slime 异步 RL 框架。

大模型
@lmsysorg 阅读 →

LatentLens:揭示 LLM 中高度可解释的视觉 Token

新论文 LatentLens 提出方法揭示大语言模型中高度可解释的视觉 token,为理解多模态模型内部机制提供新视角。

研究
@_akhaliq 阅读 →

vLLM:GitHub Star 突破 7 万

vLLM 项目 GitHub Star 达 7 万。近期进展包括 NVIDIA Blackwell 多节点生产级支持(WideEP + 专家并行)、异步调度、实时语音流式推理、多模态(文本/视觉/视频/语音)能力扩展。

大模型
@vllm_project 阅读 →

v0:支持 GTM 团队快速构建演示、AI Agent 和研究工具

Vercel v0 推出面向 GTM(市场推广)团队的新功能,可用真实数据在几分钟内构建自定义演示、AI Agent 和研究工具。

产品发布
@v0 阅读 →

ElevenLabs:伦敦峰会吸引近千人参加

ElevenLabs 在伦敦举办峰会,近 1000 名客户和合作伙伴到场。公司表示语音将取代过时的界面,通用智能将改善人们的生活。

活动
@elevenlabsio 阅读 →

宝玉:用 Claude Code Skills 构建全自动生图工作流

宝玉详细介绍如何用 Claude Code Skills 编排 Midjourney 生图、Gemini 生成、PS 去背景、加文字、上传素材等步骤,实现全流程自动化。

大模型
@dotey 阅读 →

swyx:用 Vibe Coding 在攀岩馆设计 6000 人大会网站

Latent Space 创始人 swyx 分享在攀岩馆用 AI 全程设计会议网站(含 99% 视频资源优化)的经历,称这就是 AGI 的感觉。

观点
@swyx 阅读 →

vLLM 首日支持 GLM-5:稀疏注意力+推测解码+工具调用

vLLM 宣布首日支持智谱 GLM-5(744B 参数/40B 激活),集成 DeepSeek 稀疏注意力、MTP 推测解码和工具调用等功能。

产品发布
@vllm_project 阅读 →

通义千问:Qwen-Image 2.0 修复古诗排序和角色一致性问题

阿里通义千问修复了 Qwen Chat 中 Qwen-Image 2.0 的两个 bug,涉及古典诗词图像排序和图像编辑中的角色一致性问题。

产品发布
@Alibaba_Qwen 阅读 →

Karpathy 详解极简 GPT:将 LLM 分解为最基本的数学运算

Karpathy 解释其极简 GPT 项目原理:将完整 LLM 架构拆解为加、乘、幂、对数、指数等原子运算,用微型自动微分引擎计算梯度。

大模型
@karpathy 阅读 →

Claude 免费版新增对话压缩功能,长对话无需重新开始

Claude 免费版现已支持对话压缩功能,AI 会自动总结早期上下文,让长对话可以持续进行而无需从头开始。

产品发布
@claudeai 阅读 →

Ollama 上线 GLM-5 云端版:免费可用,支持多种 AI 编码工具

Ollama 发布 GLM-5 云端版本,免费起步,支持连接 Claude Code、Codex、OpenCode 等工具,付费用户可获得更高使用限额。

产品发布
@ollama 阅读 →

Google DeepMind:Gemini Deep Think 用智能体工作流解决研究级难题

DeepMind 发表两篇论文展示 Gemini Deep Think 如何通过智能体工作流协助解决数学、物理和计算机科学领域的研究级问题。

研究
@GoogleDeepMind 阅读 →

Anthropic 发布 Opus 4.6 破坏风险报告,主动达到 ASL-4 安全标准

Anthropic 决定主动以更高的 ASL-4 安全标准评估 Opus 4.6 的 AI 研发风险,发布了详细的破坏风险评估报告。

行业
@AnthropicAI 阅读 →

Anthropic 承诺承担数据中心电力成本,不让纳税人买单

Anthropic 宣布将 100% 承担电网升级费用,推动新电力上线并投资减少电网压力的系统,确保数据中心扩张不增加居民电费负担。

企业动态
@AnthropicAI 阅读 →

Karpathy 新作:243 行纯 Python 实现 GPT 完整训练与推理

Karpathy 发布新项目,仅用 243 行无依赖纯 Python 实现 GPT 的完整训练和推理,展示 LLM 的核心算法本质。

大模型
@karpathy 阅读 →