来自 Twitter · Hacker News · GitHub 的 AI 行业动态
GPT-Realtime-2 可构建生产级语音 Agent;Translate 版支持 70+ 输入语言、13 输出语言流式翻译;Whisper 版用于实时音频转写。
Personal Computer 作为 Perplexity Computer 进阶版现已对所有用户开放,可跨本地文件、原生 Mac 应用、Web 与 Perplexity 安全服务器执行任务。
Grok Voice Think Fast 1.0 面向真实场景客服需求,可处理多步排障与高频工具调用,在嘈杂环境下仍保持速度与准确性。
Fitbit Air 主打轻量化、无屏幕设计,舒适到可 24/7 全天候佩戴,电池续航最长可达一周。
Cursor 推出新技能 /orchestrate,基于 Cursor SDK 递归派生子 Agent 来分摊大型任务;内部用它做自调研 skill 评测,token 消耗减少 20%,后端冷启动时间缩减 80%。
Anthropic 把内部小范围运行多年的安全漏洞悬赏项目正式上线 HackerOne,向所有研究者开放申报,对发现的漏洞给予奖励。
Paul Graham 在讨论支付时表示,加上信用卡手续费就等于把 Visa 这种软件病毒一并拖进未来,应该寻找绕过传统卡组织的方案。
在 GPT-Realtime-2 进入 API 后,OpenAI 安抚等待 ChatGPT 端语音升级的用户:相关更新正在路上,但暂未公布时间。
Anthropic 公布 The Anthropic Institute(TAI)研究议程,方向包括:1)经济扩散;2)威胁与韧性;3)真实世界中的 AI 系统;4)AI 驱动的 R&D。
Sam Altman 重申 OpenAI 对开发者的态度:让一个真正优秀的工程师在 AI 加持下迸发出疯狂的产能,比把他们替换掉更酷。
Y Combinator 联合创始人 Paul Graham 表示,过去 20 年他都在教人怎么赚十亿美元——核心方法是创办一家高速增长的公司,而你只需要造出别人真心想要的产品。
马斯克为 xAI 的 Grok Voice 摇旗,建议企业把它接入客服场景,进一步加码语音 AI 在 toB 客户支持上的争夺。
Sam Altman 称用户在需要倾倒大量上下文时已习惯用语音与 AI 互动,GPT-Realtime-2 在 API 上线是相当大的一步,ChatGPT 内的语音体验也在改进中。
OpenAI 宣布 Codex 直接进入 Chrome 浏览器,能更好地与网页与应用协作,并在后台跨多个标签页并行执行任务而不接管浏览器。
Anthropic 发布新研究 Natural Language Autoencoders,训练 Claude 将自身的激活向量解码为人类可读文本,朝可解释性又迈一步。
Chamath Palihapitiya 称 Spencer Pratt 表达条理清晰、观点合理,认为其若当选 LA 市长可让城市重回安全与繁荣,呼吁公众完整观看辩论后自行判断。
OpenAI 在 API 推出最新语音模型 GPT-Realtime-2,主打 GPT-5 级推理与实时协作;同时上线流式翻译模型 GPT-Realtime-Translate 与转写模型 GPT-Realtime-Whisper。
Anthropic 宣布 Claude for Excel、PowerPoint、Word 全面 GA,Claude for Outlook 进入公开测试,Claude 在不同微软应用间流转时可携带完整对话上下文。
马斯克再度为 Cybertruck 棱角设计辩护,称其超硬不锈钢车身板厚到普通薄钢冲压机会被直接压坏,因此只能采用折面造型,并强调它兼具防弹坦克与百万美元跑车操控。
xAI 在 API 推出图像生成 Quality 模式,该模型已在 Grok 端累计生成超 3 亿张图,主打更高真实感、更强文字渲染和更可控的创意。
马斯克透露 xAI 正在 Colossus 2 超算集群中同时训练多个 Grok 模型,并称 Grok Built 工具调用框架进展顺利。
马斯克在 X 简短表态,xAI 旗下大模型 Grok 仍在持续迭代演进。
ServiceNow 在 Knowledge 2026 大会发布基于开源模型 + 英伟达 OpenShell 的长时运行桌面 Agent Project Arc,主打治理、可审计与安全执行的企业级 AI Agent。
Dreaming 功能可回顾 Agent 过往会话、提取模式并整理为长期记忆,使 Agent 在多轮使用中持续积累经验,目前开放申请试用。
a16z 合伙人 David George 列举数据反驳:软件工程师需求上升、占新增就业份额扩大、AI 暴露行业薪资高于趋势线、PM 职位空缺创 2022 年以来新高。
Anthropic 联合创始人 Dario Amodei 与 Daniela Amodei 由首席产品官 Ami Vora 主持,PT 时间下午 1 点开播。
OpenAI 工程师 Mark Handley 与 Greg Poynting 在播客中讲解新发布的 MRC 协议,剖析超大规模训练集群跨芯片可靠通信的工程挑战与行业开放策略。
DeepMind 联手 EVE Online 开发商,借助玩家驱动的复杂宇宙作为安全沙盒,研究 AI 智能体的记忆、持续学习和长期规划能力。
Cursor 3.3 上线后可查看 Agent 在 rules、skills、MCP、子 Agent 上的上下文消耗占比,便于诊断和优化提示工程配置。
首批大学四年全程使用 ChatGPT 的 26 位应届生入选 ChatGPT Futures Class of 2026,案例涵盖 150 万颗未知天体测绘、墙后灾后幸存者探测、1 亿张星系图检索等。