来自 Twitter · Hacker News · GitHub 的 AI 行业动态
LlamaParse Agentic Plus 模式新增边界框视觉定位功能,可精确解析复杂 LaTeX 公式、手写文字识别、多栏布局和信息图表。
LlamaIndex 引用 Karpathy 观点指出,上下文工程正取代提示工程成为构建 AI Agent 的关键,核心在于为 LLM 填充恰当的上下文信息。
Browserbase 宣布支持 Stripe 推出的机器支付协议 MPP,AI Agent 现可通过新端点按搜索和浏览次数进行自动支付。
RaspberryTips 发布在树莓派上运行 n8n 的完整指南,涵盖 Docker 配置、核心节点、项目实例和常见问题,适合轻量级自托管自动化场景。
研究者提出 WorldCam,以相机位姿为统一几何表示,实现自回归交互式 3D 游戏世界生成。
英伟达发布大规模开源模型和数据集,涵盖 Agent AI、机器人、自动驾驶和研究领域,旨在加速专业 AI 开发。
宝玉推荐了一款终端运行的开源视频剪辑工具,可标记起始时间点并导出可控宽高比的剪辑片段,设计非常简洁。
英伟达 GTC 直播节目汇聚科技、基础设施和工业领域顶级领袖,共同探讨加速计算和 AI 如何变革芯片设计、数据中心、制造业和机器人等领域。
英伟达回顾 2006 年推出的 CUDA 并行计算平台,20 年后已服务全球 600 万开发者,呼吁开发者加入下一波创新浪潮。
微软研发的 MicroLED 数据中心网络系统通过数千个并行通道传输数据,比主流激光光缆约节省 50% 能耗,同时支持 AI 和云服务的大规模数据流。
英伟达 GTC 大会主题演讲中,黄仁勋阐述了 AI 工厂的兴起、Agent AI 系统及驱动机器人和工业的物理 AI,以及新一代加速计算平台。
Runway 推出 Big Ad Contest,参赛者可从 7 个创意简报中选择,为虚构产品制作广告,无客户限制,为期两周,最高奖金 10 万美元。
Replit 推出为期 4 周的 Agent 4 内容挑战赛,每周评选一位获胜者,参赛者需构建作品并拍摄分享,总奖金池 2 万美元。
MiniMax-M2.7 现可通过 Ollama 云端使用,专注编程和 Agent 任务,支持在 Claude Code 和 OpenClaw 中直接调用。
Karpathy 分享黄仁勋签名照背后故事,回忆 2015 年 GTC 上黄仁勋向游戏和科学计算观众宣告深度学习将改变一切,并引用了他的博士论文作为案例。
Perplexity 宣布 AI 浏览器 Comet 的 iOS 版本正式登陆 App Store,用户可即刻下载使用。Comet 此前已上线企业版,此次移动端版本的发布进一步扩展了其多端覆盖能力。
Ollama 宣布 NVIDIA Nemotron 3 Nano 4B 模型现已可通过 Ollama 运行。该模型是 Nemotron 家族新成员,专为资源受限硬件上的 Agent 构建与运行场景设计,可与 Pi 轻量级 Agent 运行时配合使用。
Anthropic 宣布向 Linux 基金会捐款,以持续强化 AI 所依赖的开源软件基础设施安全。Anthropic 指出开源生态几乎支撑了全球所有软件系统,随着 AI 能力不断增强,开源安全的重要性日益凸显。
Perplexity 发布 Comet Enterprise,将其最强大的 AI 浏览器带入企业团队。企业版支持在浏览器内直接完成研究、任务自动化等工作,无需离开浏览器切换工具。
Cursor 团队通过强化学习训练 Composer 进行自我摘要,替代原有的 Prompt 方式,使代码上下文压缩(Compaction)错误率降低 50%。改进后 Composer 能成功完成需要数百步操作的复杂编程任务。
Ollama 发布 0.18.1 版本,新增 OpenClaw 网络搜索与网页抓取插件,支持本地及云端模型实时获取最新网络内容。同时新增非交互式(无头)启动模式,适用于 Docker、CI/CD 流水线及自动化脚本场景。
Runway 联合 NVIDIA 在 GTC 大会上发布实时视频生成研究预览,新模型运行于 Vera Rubin 硬件上,可即时生成高清视频,首帧延迟低于 100ms。这是其通用世界模型 GWM-1 的重要里程碑,开辟了视频模型与世界仿真的全新设计空间。
OpenAI 面向开发者社区发起了一项编程挑战活动,邀请开发者参与测试并展示 Codex 的编程能力。具体赛题及规则详见官方链接。
Moonshot Kimi 官方宣布已将最新研究论文上传至 arXiv,供学术社区免费获取阅读。配图显示了相关论文内容,具体研究方向待进一步阅读确认。
Sam Altman 回应用户对 Codex 前途的担忧,明确表示 Codex 不会关闭,「恰恰相反」。他暗示团队正在开发令人期待的新功能,并表示用户会喜欢的。
Anthropic 发起了一项大规模定性调研,邀请 Claude 用户分享 AI 使用方式、期许与担忧。一周内共有近 81,000 人响应,成为同类调研中规模最大的一次,调研报告已公开发布。
Anthropic 宣布开发者大会「Code with Claude」今春回归,举办城市为旧金山、伦敦和东京。活动提供全天工作坊、产品演示及与 Claude 团队一对一答疑,支持线上远程参与或申请现场出席。
OpenAI 发布 GPT-5.4 mini,即日起在 ChatGPT、Codex 及 API 中上线。该模型针对编程、计算机操作、多模态理解和子 Agent 任务进行了专项优化,速度是 GPT-5 mini 的 2 倍。
Andrej Karpathy 透露收到了 Jensen Huang 与 NVIDIA 赠送的一台神秘设备,事先只被告知「需要 20 安培电流」。他表示这台设备将成为其 Dobby 机械爪等各类实验项目的新家,并表达了感激之情。
OpenAI CEO Sam Altman 感慨 AI 时代到来前,开发者逐字逐句手写极度复杂软件的艰辛付出。他表示现在已很难想象那需要多大的努力,并向所有让行业走到今天这一步的人致谢。