May 27, 2026
Key Signals
-
Cognition(Devin)以 250 亿美元投前估值融资超 10 亿美元,八个月内估值翻倍有余。 本轮由 Lux Capital、General Catalyst 和 8VC 领投,代表了顶级风投对独立 AI 编程创业公司的重大信心投票——此前市场普遍预期 Anthropic、OpenAI 和 Google 等模型厂商将主导该领域。Cognition 报告年化收入已达 4.92 亿美元,企业使用量连续六个月环比增长 50%,客户包括梅赛德斯-奔驰、NASA 和高盛。 [1]
-
托管 AI Agent 运行时已成为行业标配——Google、Anthropic 和 AWS 在六周内发布了几乎相同的产品。 Google 在 I/O 大会上将 Antigravity 重新定位为 Agent 平台,紧随 Anthropic 的 Claude Managed Agents(4月8日)和 AWS Bedrock AgentCore(4月22日)之后。基于 Markdown 的配置格式(AGENTS.md、SKILL.md)——目前已存在于超过 6 万个代码仓库中,由 Linux 基金会托管——正悄然成为可移植的 Agent 定义层,这意味着平台选择现在取决于成本、数据驻留地和模型质量,而非运行时功能。 [2]
-
安全研究人员警告:随着 AI 编程 Agent 自主安装无人审查的软件包,责任缺口日益扩大。 Aikido Security 的 CEO 描述了 Agent 拉取依赖时"无人承担责任"的局面——这一缺口正影响着非开发人员团队也在使用 AI 工具的企业。供应链攻击面正在快速扩大:Snyk 的审计发现近 4000 个 AI Agent 技能中超过三分之一存在安全缺陷,多家初创公司(估值 10 亿美元的 Socket、Endor Labs、Chainguard、Arcjet)正竞相填补这一空白。 [3]
-
Claude Code v2.1.152 发布了
/code-review --fix(自动应用审查发现),同时取消了 Auto 模式的手动同意要求。 技能现可在 frontmatter 中声明disallowed-tools,新增/reload-skills命令支持不重启会话即可热加载技能,SessionStart 钩子获得了设置会话标题和触发技能重载的能力。该版本还新增了 MessageDisplay 钩子用于实时转换助手输出,标志着 Anthropic 正在推进完全可扩展的 Agent 管道。 [4] -
Copilot SDK v1.0.0-beta.9 引入了多租户隔离的
CopilotClientMode.Empty、工具使用失败钩子,以及逐消息agentMode选择——GA 版本预计约一周后发布。 Empty 模式防止用户特定状态在租户间泄露(无内置工具、消毒的系统提示、需显式存储),解决了关键的企业部署问题。agentMode API 终于让 SDK 使用者能够在所有六种语言的 SDK 中以编程方式逐消息请求 plan、autopilot 或 shell 模式。 [5] -
Uber CTO 透露其 Claude Code 预算"已经爆了",凸显 tokenmaxxing 正成为行业性问题。 Lanai 推出了 Token Tuner,将 token 消耗映射到实际工作流成果并生成生产力评分;Uber COO 描述这是一个"令人崩溃的时刻",迫使公司在 token 消耗与人员编制之间做出权衡。从原始使用指标向成果度量的转变,标志着企业 AI 编程采用正在走向成熟。 [6]
-
Copilot CLI 在一天内发布了六个版本(v1.0.55-2 至 v1.0.55-7),以新增
/autopilot命令、单元格渲染器全量发布和钩子进度流为亮点。/autopilot命令(别名/goal)帮助 Agent 专注于长期运行的目标,而会话 RPC 上的插件目录让 SDK 客户端可以按会话挂载技能。单元格渲染器面向所有用户默认启用,标志着终端 AI 编程用户体验的重要里程碑。 [7][8][9][10][11]
AI Coding News
-
OpenAI 与思科宣布合作,利用 Codex 重新定义企业工程,实现规模化 AI 原生开发。 思科正在使用 Codex 加速 AI Defense 相关工作并自动化缺陷修复。这代表了 Codex 云端编程 Agent 能力在正式可用后又一次重大企业级验证。 [12]
-
Warp 正在使用 GPT-5.5 和 OpenAI 模型协调本地、云端和开源开发工作流中的编程 Agent。 这家终端公司在多个执行环境(本地机器、云实例和开源仓库同时运作)之间编排 Agent 的方式,代表了 AI 辅助开发中一种新兴模式——本地编程与云端编程之间的边界正在消融。 [13]
-
一个名为"ADHD"的第三方 Claude Code 技能声称通过在不同认知框架下扇出并行发散思维,使 Agent"思考能力提升 2 倍"。 基于 Claude Agent SDK 构建,ADHD 采用带有认知框架分支、生成器-评判器分离和剪枝的思维树方法。专家持谨慎态度:Empromptu.ai CTO Sean Robinson 指出这是"一种熟悉的并行采样和选择策略",而前 Google 副总裁 Andrew Moore 承认"真正新颖之处在于找到了在一组并行思考者中创造多样性的另一种方式"。基准测试仅基于六个问题。 [14]
-
Pullfrog——由 Zod 作者 Colin McDonnell 开发的开源 AI GitHub 机器人——作为 CodeRabbit 的模型无关替代方案进入 beta 阶段。 完全在 GitHub Actions 内运行,采用自带密钥方式(支持 Anthropic、OpenAI、Google、Mistral、DeepSeek 和 OpenRouter),Pullfrog 处理 PR 审查、issue 分流、CI 自动修复和合并冲突解决。McDonnell 将其描述为"一个基于 OpenCode 和 Claude Code 的封装,旨在 CI 中运行"。 [15]
-
微软为 Azure Logic Apps 添加了沙箱化代码解释器,使 AI Agent 能够在 Hyper-V 隔离会话中生成并执行 Python、JavaScript、C# 和 PowerShell 代码。 每个会话运行在硬件级隔离环境中,LLM 接收自然语言指令、生成代码并在单一治理工作流中执行。这将 Logic Apps 定位为面向集成的 Agent 平台,与 Microsoft Foundry(专业代码编排)和 Copilot Studio(低代码)并列。 [16]
-
AWS DevOps Agent 详细介绍了其用于自主事件调查的多 Agent 架构,采用并行假设生成和反证验证。 系统将运维分解为分诊(快速分类)、调查(多假设根因分析)、缓解和预防等能力——全部构建在提供架构感知能力的应用拓扑图之上。该方法模拟了经验丰富的 SRE 团队的工作方式但以机器速度运行,生成多个竞争性理论,仅在证据明确支持时才收敛到根因。 [17]
-
OpenAI、Thrive 和 Crete 展示了用 Codex 构建自我改进的税务 Agent,可自动化申报并随时间提高准确性。 该案例研究展示了 Codex 在准确性至关重要的受监管领域中构建自主 Agent 的能力,将该工具的定位从纯软件工程扩展到领域特定的工作流自动化。 [18]
Feature Update
-
Claude Code v2.1.152 发布了包含
/code-review --fix、技能扩展性改进和 Auto 模式变更的重大功能集。/code-review --fix命令将审查发现(复用、简化、效率建议)直接应用到工作树,/simplify现作为其快捷方式。技能获得了disallowed-toolsfrontmatter 支持以在激活时移除工具,SessionStart 钩子现可返回reloadSkills: true并设置会话标题。Auto 模式不再需要手动同意。其他改进包括 Vim 模式/反向历史搜索、全屏模式实时思考计时器和 OpenTelemetry 会话入口点指标。 [4] -
Copilot SDK v1.0.0-beta.9 在所有六种语言的 SDK 中添加了多租户隔离、失败钩子和编程化模式选择。
CopilotClientMode.Empty从干净状态启动会话(无内置工具、禁用宿主集成、消毒的系统提示)以防止跨租户状态泄露。postToolUseFailure钩子使观察失败的工具执行与仅成功的钩子分离。MessageOptions 上的agentMode字段(interactive、plan、autopilot、shell)解决了此前无法从 SDK 正确请求 plan 或 autopilot 模式的问题。Rust SDK 还进行了破坏性的错误类型重构,采用 struct-with-kind() 模式。 [5] -
Copilot CLI v1.0.55-6 新增
/autopilot命令(含/goal别名)并为所有用户启用单元格终端渲染器。 扩展日志文件现按扩展捕获并在 extensions_manage 工具中呈现,.github/extensions中的项目扩展在非 git 工作区中可用,/statusline和/theme命令可在 Agent 执行期间运行。修复了 Microsoft Store 应用执行别名下 PowerShell 7 的检测问题。 [7] -
Copilot CLI v1.0.55-3 引入了钩子进度流、通过 RPC 挂载插件目录和推理 token 可见性。 长时间运行的钩子现在在时间线中显示实时状态消息,SDK 客户端可通过
session.create和session.resumeRPC 上的pluginDirectories按会话挂载 Open Plugins 格式目录。进度指示器原生集成 tmux 3.6b 面板进度状态,推理 token 计数现在对所有用户显示在会话 token 摘要中。技能优先级顺序为:项目 > plugin-dir > 个人 > 自定义。 [8] -
Copilot CLI v1.0.55-7 修复了
exit_plan_mode工具在计划模式外出现的问题,并添加了 SIGSEGV 崩溃回退到 JavaScript。 原生二进制崩溃(如 SIGSEGV)现在回退到 JavaScript 运行时而非静默退出,提高了 CLI 在崩溃场景下的韧性。 [9] -
Copilot CLI v1.0.55-5 重新设计了 MCP 配置,提供专用的可滚动服务器和工具管理界面。 MCP 配置现在在独立屏幕中打开,当内容超出可视区域时提供可滚动的服务器和工具列表,解决了配置多个 MCP 服务器用户的可用性问题。 [10]
-
Gemini CLI v0.44.0 将多种 Auto 模式合并为统一的单一 Auto 模式,并添加了 AgentSession 调用(本地和远程)。 该版本包括采用首先获胜策略的 Agent 注册和项目优先级、Sublime Text 和 Emacs 编辑器支持、gemini-3.1 模型别名和思考配置、ADK 子 Agent 标志,以及 PolicyEngine 集成到 ACP 会话中。安全修复包括自定义命令中的路径遍历防护、MCP 服务器的 NO_PROXY 支持和依赖漏洞更新。本次发布合并了超过 70 个 PR。 [19]
-
Gemini CLI v0.45.0-preview.0 发布了预览版,包含 A2A 使用元数据暴露和上下文简化。 修复内容包括防止 Termux 重启/调整大小循环、update_topic 工具的顺序执行、路由分类器绕过孤立函数响应的修复、PTY 调整大小错误抑制和 MCP 列表黑名单绕过防护。 [20]
-
OpenCode v1.15.11 添加了基于推送更新的实验性后台 Agent 和提供者请求超时配置。 后台 Agent 现在推送更新而无需轮询,
headerTimeout配置对 OpenAI 设置默认为 10 秒,modalities.input/output可独立设置。该版本还为插件添加了dispose钩子,修复了上游工具 ID 回归后的 Google 工具调用问题。恢复的会话不再继续孤立的中断工具。 [21] -
Codex(OpenAI)发布了 0.135.0-alpha.2,基于 v0.134.0 的对话历史搜索和基于配置文件的配置。 此前的稳定版本(v0.134.0)添加了支持大小写不敏感内容匹配的本地对话历史搜索、将
--profile作为 CLI/TUI/沙箱的主要选择器、改进了 MCP 设置(按服务器环境和 OAuth 选项),并启用了声明readOnlyHint的只读 MCP 工具并发执行。 [22] -
Kiro 为每日活动报告添加了用户电子邮件地址,提升企业管理员的可见性。
User_Email列现在与现有字段并列显示,管理员无需再将用户 ID 与单独的目录交叉引用来识别活动来源。 [23]