人工智能行业最新动态
Karpathy 表示,普通用户不应需要知道 App 的存在,LLM Agent 应该代替用户完成操作,这才是 AI 的正确方向。
Elon Musk 分享了一张经 Grok 修复并上色的历史照片,展示了 xAI 大模型在图像处理方面的能力。
Google 发布 Unified Latents (UL) 研究论文,提出统一潜空间训练方法,探索如何更高效地训练潜在表示模型。
AI 开发者宝玉分享经验,认为 Claude Agent SDK 做原型开发简单方便,但正式上线建议使用 pi-mono 或类似轻量级框架。
Google 在印度 AI 影响力峰会上宣布多项更新,包括新的实时语音对语音翻译模型,支持超过 70 种语言含 10 种印度语言,可消除对话中的语言障碍。
Supabase 邀请 Bolt.new CEO Eric Simons 举办线上活动,分享企业创新团队如何利用 AI 编程工具在 Supabase 上构建真实应用。
Together AI 发布 CDLM 方法,通过后训练方案解决扩散语言模型的 KV 缓存不兼容和高步数问题,在 Dream-7B 上实现 4.1-7.7 倍步数减少和最高 14.5 倍延迟降低,数学和编码准确率保持竞争力。
What if you could cut your sales cycle by 67% and grow to multi-seven-figure ARR with half the staff? That's exactly what @mathewtisson, CEO and Founder of @skypointcloud, has done by building 10–15…
Split view, Save to Google Drive and PDF annotations are designed to give you a productivity boost and make Chrome more helpful than ever. Here’s what to know: 1️⃣ Use split view to see two pages at…
Browserbase 宣布与 n8n 合作,在 n8n 节点目录中推出 Browserbase Agent Node,为工作流自动化增加浏览器智能代理能力。
Vercel AI Gateway 新增 Grok Imagine Video 和 Grok Imagine Image 模型,2 月 25 日前可免费使用。
Meta AI 的 alexandr_wang 在印度 AI 影响力峰会上分享了 Meta 对个人超级智能的愿景,并展示了印度开发者如何利用 AI 解决重大社会挑战。
SLA2 论文提出结合可学习路由与量化感知训练的稀疏线性注意力机制,优化 Transformer 推理效率。
自动化工作流平台 n8n 宣布与 Cognee 合作,共同推进 AI 记忆领域的技术创新。
Google 新论文发现大模型的事实性问题根源在于「召回」(Recall)而非「存储」,为提升模型可靠性提供新方向。
Replicate 宣布 Gemini 3.1 Pro 已上线平台,推理性能相比 Gemini 3 Pro 翻倍,费用保持不变。
RynnBrain 开源具身基础模型论文发布,旨在推进机器人通用智能研究。
Vercel 宣布 AI Gateway 支持视频生成,开发者可通过 AI SDK 6 的 generateVideo 函数快速接入视频生成能力。
Gemini 3.1 Pro 的 ARC-AGI-2 得分从 31.1% 跃升至 77.1%,超越 Claude Opus 4.6(68.8%)和 GPT-5.2(52.9%),Google 重回 AI 第一梯队。
Google 分享一位员工使用 Gemini 优化储蓄策略、创建专业财务追踪工具的实际案例。
宝玉感慨技术老手常一眼看穿技术本质却忽视产品价值,许多成功产品并不需要高深技术含量。
Google 用 Gemini 3.1 Pro 实时构建国际空间站追踪面板,展示模型在多流推理、实时 API 对接和物理渲染方面的能力。
Perplexity 宣布 Gemini 3.1 Pro 已向所有 Pro 和 Max 订阅用户开放使用。
Replit 发布 Animation 功能,用户可通过 Vibe Coding 在数分钟内生成视频内容,由 Gemini 3.1 Pro 驱动。
Karpathy 分享用 Vibe Coding 一小时编写个人心率训练仪表盘的经历,展望高度定制化软件将成为新趋势。
swyx 认为 Gene Kim 和 Steve Yegge 去年 11 月关于后 IDE 时代的演讲是 AIE 历史上最精准的预测,2026 年 AI 编程正从 IDE 向 Agent 工程化转型。
ElevenLabs 发布 ElevenAgents 中的 Experiments 功能,支持运行 A/B 测试来优化 Agent 配置,涵盖提示词结构、工作流逻辑、语音和个性等维度。
Google DeepMind 展示使用 Gemini 3.1 Pro 构建的城市规划应用,模型能处理复杂地形、规划基础设施并模拟交通,生成高质量可视化效果。
Cursor 在过去三个月陆续上线了全平台 Agent 沙箱功能,允许 Agent 在安全环境中自由运行,仅在需要越界时请求用户批准。
Perplexity 的新应用 Comet 已在 Apple App Store 上线 iOS 预购,用户可提前注册体验。