人工智能行业最新动态
Elon Musk 宣布「To the stars! SpaceX 与 xAI 现已成为一家公司」,这是 AI 行业与航天行业的历史性整合,预计将加速 AI 在太空探索领域的应用
Anthropic Fellows 研究发现推理时间越长,模型越不一致;更聪明的模型往往更不一致。AI 失败更像「工业事故」而非追求错误目标
A.A.Murakami 使用 Claude 作为工作室协作者,创作融合雾、泡沫和等离子体等自然现象的多感官沉浸式装置艺术
OpenAI 演示 Prism 如何让 GPT-5.2 在 LaTeX 项目中工作,具备完整论文上下文理解能力,科学工具链即将迎来变革
预测 2026-2028 AI 自动化白领工作,2027-2030 机器人自动化蓝领,2028-2032 AI 开始科学突破,2032 年 AI 破解无限能源问题
Vercel v0 团队发布预告「Big day tomorrow…」,暗示今日(2月3日)将有重大更新,新版 v0 支持导入 GitHub 仓库、多框架和全栈应用开发
Sam Altman 回应近期传闻,称「我们热爱与 NVIDIA 合作,他们制造世界上最好的 AI 芯片,希望长期保持大客户关系」
OpenAI 发布 Codex 独立应用,支持多 Agent 并行工作、可复用 Skills、自动化任务调度。限时向免费用户开放,付费用户速率限制翻倍
Sam Altman 分享使用 Codex 构建应用的体验,称 AI 提出的功能点子比自己想的更好,坦言「感到有点没用,这让人难过」
Kaggle Game Arena 新增狼人杀、扑克、国际象棋等 AI 挑战,测试模型在真实场景中的沟通、共识构建等能力
xAI 官方宣布被 SpaceX 收购,配文「One Team」并附公告链接。这标志着 Elon Musk 旗下 AI 与航天业务的正式整合
Vertex AI 错误日志泄露 claude-sonnet-5@20260203,社区预测 2 月 3 日发布。传闻价格为 Opus 4.5 的一半,SWE-Bench 得分超 80%,支持多 Agent 并行
@kimmonismus 称「更多泄露正在涌入,周二将会非常重大」,暗示多个 AI 模型即将发布
xAI 团队邀请用户试用 Grok Imagine 1.0 图像生成服务,分享最佳创作并标记 @xai,团队会阅读每条回复
xAI 的 Grok Imagine API 模型在 Artificial Analysis 基准测试中排名第一,展示了 Imagine 1.0 背后核心模型的卓越质量
Bindu Reddy 预告即将发布的模型:Grok 4.2、Sonnet 5、GPT 5.3、Gemini Pro GA、Qwen 3.5、Meta Avocado、DeepSeek v4 等,AI 寒冬已结束
Bindu Reddy 认为 LLM Token 价格具有误导性,应该衡量完成特定任务的成本,开源和 OpenAI 模型在该指标上往往更优
vLLM 发布首个多模态稳定版 v0.14.0,包含 180 次提交,70+ 贡献者参与,支持异步分块流水线重叠、Qwen3 视觉支持等新特性
v0 Prompt to Production 全球黑客周正式启动,超过 5000 名开发者在全球 53 个城市、28 个国家同步使用 v0 构建项目
Elon Musk 将 AI 的发展速度比作"超音速海啸",暗示 AI 技术正以前所未有的速度席卷全球
Andrej Karpathy 引用研究表明 LLM 持续接触低质量网络文本会导致持久的认知能力下降,自称感觉在变笨
Moltbook 首页新增 Top Pairings 功能,展示与 AI 智能体配对最多的 X 账号排行榜
Bindu Reddy 认为距离 AI 自动化软件工程仅需两代模型和六个月时间,关键是让 AI 能解决大型代码库中的复杂 Bug
Bindu Reddy 预测未来公司将由 10-20 人的小团队运营,所有员工都是股东,负责监督超级智能体
Bindu Reddy 预测 DeepSeek v4 将在 2 月发布并追平当前闭源模型水平,但 Anthropic 和 OpenAI 的新版本将继续领先
Matt Schlicht 透露运营 Moltbook 的 AI 机器人 Clawd Clawderberg 运行在一台 Mac Mini 上,成为该类型中最成功的案例
Moonshot AI 发布 Kimi K2.5 与 OpenClaw 平台的集成指南,推荐使用 Kimi Coding Plan 获得最佳体验
Vercel Sandbox 正式 GA,为 AI Agent 提供安全计算环境,已为多个平台提供生产级服务,每日支持 270 万次关键构建
Vercel v0 在旧金山开设首个 v0 Studio 体验店,让用户提前体验新版 v0,支持导入 GitHub 仓库和 Vercel 项目
nanochat 现可在单个 8xH100 节点上 3 小时内以约 $73 成本训练 GPT-2 级别 LLM,相比 2019 年 OpenAI 的 $43K 成本降低 600 倍