AI Coding News

📈 2026年五月月度趋势

市场趋势

AI 编程市场迎来拐点——编排基础设施已决定性地超越模型能力，成为核心竞争优势。 整个五月，所有重大信号都指向同一方向：Cursor 发布了其 SDK（5月1日），而 SpaceX 传闻中 600 亿美元的收购兴趣针对的是其编排层而非模型权重；IBM Bob 在 80,000 名开发者中的部署证明了智能模型路由——而非更大的模型——才是企业价值的驱动力；OpenRouter 以 13 亿美元估值完成 1.13 亿美元 B 轮融资（5月26日），验证了跨 400+ 模型处理每月 100 万亿 token 的模型无关网关已成为生产现实。Google 明确表示不在乎开发者使用哪种编程工具，JetBrains 将自己定位为"唯一独立的 AI 编程工具供应商"（5月22日），正是因为它可以在 Gemini、Claude 和 GPT 之间自由切换。共识已经明确：智能能力按季度商品化，而上下文管理、工具调用、可观测性和多模型编排才是持久的护城河。
前所未有的资本集中表明 AI 编程已成为万亿美元估值级别的行业。 Anthropic 在 5 月 28 日以 9650 亿美元估值完成 650 亿美元 H 轮融资——可能是其 IPO 前的最后一轮私募——年化收入突破 470 亿美元，预计 130% 的增长将带来首次运营盈利。Cognition（Devin）在 5 月 27 日以 250 亿美元估值融资 10 亿美元，年化收入 4.92 亿美元，环比增长 50%，客户包括梅赛德斯-奔驰、NASA 和高盛。OpenRouter 一年内估值翻倍至 13 亿美元。Anthropic 的算力需求驱动了与 Akamai 的 18 亿美元交易（5月9日）以及与 SpaceX Colossus 1 超级计算机（220,000+ GPU，300+ MW）的合作，使 Claude Code 速率限制翻倍。这些数字反映出 AI 编程工具已从实验性产品转变为收入关键基础设施，而竞争所需的资本已超过任何没有超大规模云厂商支持的初创公司所能承受的范围。
企业采用指标跨越关键阈值，同时暴露出深层的度量危机。 Airbnb 报告 60% 的新代码由 AI 生成（5月8日），Claude Code 全球采用率达到 18%（美国/加拿大为 24%，较 2025 年中增长 6 倍），Google DORA 量化了 500 人工程组织 39% 的第一年投资回报率（5月11日）。然而，一篇严谨的文章列举了 AI 编程生产力度量的十二种方法论缺陷（5月20日），引用研究表明 AI 工具使有经验开发者的任务完成时间增加了 19%，且 METR 甚至无法重复其生产力研究，因为开发者拒绝在没有 AI 工具的情况下参与（5月29日）。Amazon 在员工刷量后关闭了 "Kirorank" token 追踪排行榜，Uber 在四个月内耗尽了 2026 年全年 AI 预算却未获得可衡量的收益，Meta 也关闭了类似的排行榜。感知生产力（开发者喜欢这些工具）与实际生产力（企业损益表影响不明确）之间的差距成为行业中最重要的未解决问题。
"Token 极大化"时代在企业面对不可持续的 AI 编程成本时戛然而止。 GitHub 在 6 月 1 日过渡到基于使用量的计费，引发了开发者的广泛反对（5月30日），部分用户预计成本将从每月 29 美元飙升至 750-3,000 美元。Uber 的 CTO 透露他们的 Claude Code 预算"已经被彻底花完"（5月27日）。一项详细分析显示，Opus 4.8 在最大强度下为一个任务消耗了 1650 万 token（17.26 美元），而 GPT-5.5 以 590 万 token（5.57 美元）完成了相同任务——同一输出三倍的成本。Lanai 推出了 "Token Tuner" 将支出映射到产出，Factory 报告将每个查询路由到最便宜的可用模型——开放模型使用量一个月内增长了三倍。行业正经历从补贴性固定费率定价（为推动采用而设计）到可持续使用量计费（为盈利而设计）的痛苦转型，迫使开发者将模型选择视为成本优化问题，而非"始终使用最好模型"的默认思维。
Amazon 撤销 Kiro 独占令，揭示了企业 AI 编程中单一供应商策略的不可行性。 在大约 1,500 名内部员工联署反对 2025 年 11 月独占使用 Kiro 的指令后，Amazon 副总裁 Jim Haughwout 批准了对 Claude Code 和 Codex 的全公司访问（5月5日/10日）。尽管 Amazon 声称 83% 的工程师仍"主要"使用 Kiro，但这一逆转证明，即使投入数百亿美元于 AI 供应商的公司，也无法在第三方替代方案拥有更强开发者吸引力时强制推行专有工具。这一模式——开发者偏好压倒企业指令——正在重塑整个行业的企业采购策略，ServiceNow 明确拥抱"零开发者忠诚度"，而 JetBrains、Coder Agents 和 OpenCode 都将自己定位为供应商无关的替代方案。
Anthropic 和 OpenAI 在 72 小时内相继推出专业服务公司，以金融服务作为企业 AI 部署的滩头阵地。 Anthropic 的服务部门（由 Blackstone、高盛和红杉支持）将应用 AI 工程师嵌入中型市场客户，而 OpenAI 的 "DeployCo" 收购了拥有 150 名前线部署工程师和 40 亿美元以上投资的咨询公司 Tomoro（5月22日）。前线部署工程师职位在 2025 年 1 月至 9 月间增长了 800% 以上。MIT 的 NANDA 倡议发现 95% 的企业 AI 试点未产生可衡量的损益表影响——问题在于实施而非模型质量。两家实验室对服务收入的趋同表明，仅靠 API 访问无法弥合模型能力与生产部署之间的差距，增长的下一阶段需要深入的企业集成服务。

关键发展

Claude Opus 4.8 携"动态工作流"发布——该功能可编排数十到数百个并行子代理——为智能编程能力确立了新的天花板。 5 月 28 日发布，距 Opus 4.7 仅 41 天，该模型在智能编程基准上得分 69.2%（对比 GPT-5.5 的 58.65% 和 Gemini 3.1 Pro 的 54.2%），据报道让代码缺陷未被注意的概率降低了四倍。Claude Code v2.1.154 同日发布，带有 /workflows 命令可在数百个代理间并行分发工作，而快速模式成本降至标准费率的 2 倍（此前倍数更高）。GitHub 在首日即以 15X 高级请求乘数在所有 Copilot 平台上提供了 Opus 4.8。从 Opus 4.7 到 4.8 不到六周的快速发布节奏——结合 Anthropic 9650 亿美元估值和 SpaceX 算力合作——表明 Anthropic 正在积极推进以保持其在智能编程质量方面的领先地位。
Google 在 I/O 2026 上执行了本月最重大的平台战略转变，将 Gemini CLI（100K+ GitHub stars）转向闭源 Antigravity CLI，同时推出 Gemini 3.5 Flash。 5 月 19 日宣布，向 Antigravity CLI 的过渡给免费/个人用户至 6 月 18 日的迁移期限，而企业客户保留 Gemini CLI 访问权。Gemini 3.5 Flash 在 TerminalBench 2.1 上得分 76.2%（超越 Google 自家 3.1 Pro 的 70.3%），输出速度约 280 token/秒，价格不到前沿竞争者的一半。Google 的战略架构将 3.5 Pro 定位为编排者/规划者，Flash 作为并行子代理工人处理蛮力工具使用——设计用于数小时的自主运行。然而，早期 Antigravity 用户报告 token 配额大幅降低（有些在 6-7 个提示后就触及限制），引发了对该平台能否兑现承诺的担忧。Google 还向 GPT、Claude 和本地 Gemma 4 模型开放了 Android Studio，提议将 WebMCP 作为开放浏览器代理标准，并发布了 Chrome DevTools for agents 1.0——拥抱模型多元化而非 Gemini 排他性。
GitHub Copilot 通过一个月的协调发布，从建议引擎演变为完整的智能开发平台。 关键里程碑包括：技术预览版 Copilot 桌面应用（5月14/16日）用于独立代理管理；远程控制在 Mobile、web、VS Code 和 JetBrains 上 GA（5月18日）；用于程序化云代理任务的 REST API（5月13日）；一键修复失败的 Actions（5月18日）；企业托管插件（5月6日）；带 10% 成本折扣的智能自动模型路由（5月20日）；GPT-5.3-Codex 作为首个 LTS 模型具有 12 个月可用性保证（5月17日）；以及 Claude Opus 4.8 首日全平台可用（5月28日）。Copilot CLI 在五月发布了 20+ 版本，从 v1.0.40 到 v1.0.57，引入了 /autopilot 模式、/security-review 扫描、/rubber-duck 跨模型评审、MCP 服务器注册表搜索、持久记忆控制和 OpenTelemetry GenAI 语义约定。Copilot SDK 在六种语言 SDK（TypeScript、C#、Python、Go、Rust、Java）中从 beta.2 推进到 beta.10，计划于六月初 GA。
OpenAI Codex 完成了从 TypeScript 原型到成熟 Rust 原生平台的转型，仅五月就发布了 50+ 个版本。 稳定版本从 v0.129.0 推进到 v0.135.0，关键新增包括：无头远程控制模式（v0.130.0）、用于浏览器原生代理操作的 Chrome 扩展（5月8日）、默认启用的持久化 Goals（v0.133.0）、统一配置管理与对话历史搜索（v0.134.0）、codex doctor 诊断（v0.135.0）以及 Python SDK 达到 beta.2。Codex 还进入了 ChatGPT 移动应用（5月14日），支持从 iOS/Android 完整的远程代理管理，OpenAI 宣布了与 Dell（本地部署）、Cisco、Virgin Atlantic、Sea Limited 等的企业合作。在 Greg Brockman 领导下的 ChatGPT-Codex 产品统一（5月16日）表明 OpenAI 将智能编程视为与其旗舰产品不可分割的一部分。
Claude Code 在整个五月的演进使其成为功能最丰富的终端编程代理。 从 v2.1.126 起步，通过 30+ 个版本达到 v2.1.158。主要新增包括：Agent View 多会话管理（v2.1.139，5月11日）、通过 /goal 实现自主目标追踪、无需本地基础设施的事件驱动自动化 Routines（5月15日）、带 GitHub PR 内联评论的 /code-review（v2.1.147，5月21日）、配合 Opus 4.8 的动态工作流（v2.1.154，5月28日）、带 claude plugin init 的自动加载插件系统（v2.1.157，5月29日），以及 Auto 模式扩展至 AWS Bedrock/Google Vertex/Microsoft Foundry（v2.1.158，5月30日）。独立的 Agent SDK 信用额度池的引入（5月14日宣布，6月15日生效）重构了程序化使用的计费，而 MCP 隧道和自托管沙箱（5月19日）通过将代理编排与执行分离来解决企业部署阻碍。
Cursor 积极地超越 IDE，扩展为跨平台代理编排系统。 关键发布包括：基于 Moonshot Kimi K2.5 采用新颖 RL 训练的 Composer 2.5（5月18日）、通过异步子代理实现并行计划执行（5月7日）、通过 @Cursor 委派任务的 Microsoft Teams 集成（5月11日）、从工作项执行代理的 Jira 集成（5月19日）、带 Dockerfile 配置和 70% 更快缓存构建的云代理开发环境（5月13日）、具有多仓库能力的 Agents Window 中的 Automations（5月20日），以及使用分类器子代理批准/沙箱/升级工具调用的 Auto-review 模式（5月29日）。Cursor 还透露正在与 SpaceXAI 合作，使用 Colossus 2 上百万 H100 等效算力的 10 倍总计算从头训练一个显著更大的模型，表明 AI 编程公司正在前沿规模投资专有模型训练。
OpenCode 在 GitHub stars 上超越 Claude Code（157K 对约 122K），发布 25+ 个版本证明了供应商无关方案的可行性。 该项目的飙升源于 Anthropic 一月份的 OAuth 锁定，阻止了第三方工具通过 Claude Pro 和 Max 订阅进行认证。五月关键发布包括：用于仓库研究的 Scout 代理（v1.14.42，5月9日）、后台子代理（v1.14.51，5月15日）、基于 Effect 的核心事件系统（v1.15.0）、原生 OpenAI 运行时路径（v1.15.5）、TUI diff 查看器（v1.15.6）、Grok OAuth 登录（v1.15.7），以及实验性 OpenAI 响应 WebSocket 传输（v1.15.12）。托管型（Claude Code、Codex）与供应商无关型（OpenCode、Goose）之间的生态系统分化类似 Docker 与 Podman 的格局——开发者在垂直集成和前沿模型容量与可移植性和退出自由之间做出选择。
Anthropic 的 Claude Mythos Preview 模型在所有主流操作系统和浏览器中发现了数千个零日漏洞，从根本上改变了软件安全的经济学。 五月初披露，Mythos 仅在 Firefox 150 中就识别了 271 个漏洞（包括存在 15-20 年的 bug），促使美联储主席、财政部长和银行 CEO 举行紧急会议，并触发了 Project Glasswing——在受控推出中给予约 40 家公司早期访问权。OpenAI 以 GPT-5.4-Cyber 通过 Trusted Access 计划回应。Mozilla 的定制代理框架将 Mythos 与 Firefox 的构建和模糊测试基础设施配对进行动态假设测试——实现了"几乎零误报"。在对手复制该能力前的六到十二个月窗口期内，防御者有一个正在关闭的机会窗口来修补 AI 发现的漏洞。

技术转变

MCP（模型上下文协议）从实验性协议成熟为企业基础设施标准，具备治理、安全工具和所有主要平台的普遍采用。 本月 MCP 里程碑包括：GitHub MCP Server 密钥扫描 GA 和依赖扫描进入公开预览（5月5日）；Anthropic 发布用于私有网络访问的 MCP 隧道和自托管沙箱（5月19日）；AWS MCP Server 以完整 API 覆盖和基于 IAM 的治理达到 GA（5月24日）；Copilot CLI 添加 /mcp search 用于基于注册表的服务器发现（5月15日）；以及 Linux 基金会的 Agentic AI Foundation 任命首位执行董事领导 MCP 治理（5月6日）。然而，Starlette 中的关键 "BadHost" 漏洞（CVE-2026-48710，5月26日）——FastAPI、vLLM 和大多数 MCP 服务器的路由核心——证明该协议的快速采用创造了集中的攻击面。从工具连接到数据治理层（MCP 作为每小时处理数百个请求的自主系统的合规基础设施）的转变代表了该协议的下一个演进阶段。
多代理编排成为主导架构模式，所有主要工具都发布了并行执行和代理协调原语。 OpenAI 开源了 Symphony（5月17日）——一个 SPEC.md 驱动的编排器，通过 issue 追踪器协调多个 Codex 代理，消除了"人类注意力"瓶颈。Claude Code 发布了可调度数百个并行子代理的动态工作流（5月28日）。Cursor 引入了通过异步子代理的并行计划执行（5月7日）和使用分类器子代理的 Auto-review（5月29日）。Gemini CLI 在统一的 AgentProtocol 接口后发布了本地和远程子代理协议（5月12/22日）。Shopify 展示了多代理 Claude Code 模式，将多个实例通过 MCP 以树状结构连接，在单实例失败的情况下产生正确结果（5月13日）。架构共识正在趋同于：编排代理（规划者）→ 专业子代理（执行者）→ 验证代理（审查者），关键创新是代理协调在协议层面发生，而不需要自定义集成代码。
持久化云执行取代仅本地工具，成为 AI 编程代理的默认部署模型。 这一趋势体现在每个供应商中：Anthropic 带有 dreaming/记忆整合的 Claude Managed Agents（5月6日）；无需本地基础设施的 Claude Code Routines 事件驱动自动化（5月15日）；Conductor Cloud 获 2200 万美元融资推出可在开发者断开后持续运行的代理（5月14日）；GitHub Copilot 远程控制在所有平台 GA（5月18日）；用于基于浏览器的多仓库智能编程的 Kiro Web（5月7日）；Mistral 从本地会话到远程执行的云"传送"（5月1日）；以及 Mac mini 成为持久本地代理的事实标准硬件，三大运行时趋同于此（5月17日）。NVIDIA 的开源 OpenShell 沙箱运行时（5月12日）和 Incredibuild 的 Islo 凭证盲沙箱（5月1日）解决了基础设施层问题，而 Coder Agents（5月11日）提供了模型无关的自托管编排。从"我终端中的编程助手"到"在各环境中 24/7 运行的代理群"的转变现已在架构上完成。
代理安全从理论关注演变为活跃的威胁面，出现多起真实事件和新的防御原语。 本月安全事件包括：Cursor 代理通过过度授权的凭证清除了 PocketOS 的整个生产数据库（5月6日）；"利用代理生存"（LOTA）攻击在生产代理中发现了 87 个漏洞利用（5月12日）；jqwik Java 库通过 ANSI 转义序列嵌入针对 AI 代理的提示注入（5月28日）；数千个 vibe-coded 应用暴露企业数据（5月8日）。防御响应包括：NVIDIA OpenShell 使用 Linux 内核原语实现应用层以下的隔离（5月12日）；Arcjet Guards 在代理工具处理器内执行策略（5月10日）；Anthropic 的 HackerOne 漏洞赏金明确覆盖 Claude Code（5月10日）；GitHub 针对智能 CI/CD 的纵深防御架构（5月8日）；Microsoft MDASH 部署 100+ 专业代理进行自动化安全审计（5月25日）；以及 Snyk 的 Evo 持续攻击性安全用于 AI 生成的代码（5月29日）。根本挑战在于代理使用继承的人类凭证运行，同时在企业环境中的数量比人类多 144:1——仅 21.9% 的团队已将代理 OAuth 凭证纳入特权访问管理。
形式化验证和神经符号方法进入 AI 编程工作流，超越了仅基于概率的质量保证。 AWS 将 SMT 求解器嵌入 Kiro 的需求分析（5月15日），在代码生成开始之前以数学方式证明规范中的矛盾和缺口——不是概率性标记而是形式化验证。在覆盖 35 个项目和 1,400+ 验收标准的内部测试中，约 60% 的初稿需求需要细化。一种名为"计划"的新架构原语提议折叠 CI 内/外循环（5月21日），在数秒内针对真实环境运行端到端集成检查。Google 的 Genkit 中间件在模型调用周围添加了可编程拦截（5月24日），而 Cursor 的 Auto-review 分类器代表了可学习的安全层。形式化方法与 LLM 驱动生成的融合表明，未来的架构不是"AI 写代码人类审查"，而是"AI 写代码、形式化方法验证不变式、AI 修复违规"——一个完全自动化的循环，人类定义规范和批准架构，而不是逐行审查输出。
快速的模型弃用周期成为 AI 编程生态系统的定义特征，迫使企业将模型管理视为基础设施。 GitHub 弃用了 GPT-5.2 和 GPT-5.2-Codex（6月1日截止，5月1日宣布）、Claude Sonnet 4（5月7日）、Grok Code Fast 1（5月15日）和 GPT-4.1（6月1日），同时将 GPT-5.3-Codex 设为首个具有 12 个月保证的 LTS 模型（5月17日）。OpenAI 将 GPT-5.5 Instant 部署为默认 ChatGPT 模型（5月5日），Claude Opus 4.8 在 Opus 4.7 仅 41 天后到来（5月28日）。这种节奏意味着企业管理员必须持续更新模型策略，内部安全审查变成有时间限制的而非彻底的，基于特定模型行为构建的团队面临季度性破坏风险。GPT-5.3-Codex 的 LTS 指定代表了行业首次尝试提供企业所需的稳定窗口——承认当前模型轮换速度与企业治理流程不兼容。

开发者影响

智能编程导致的开发者倦怠和技能退化成为职业的公认结构性风险。 决策疲劳将高效工作时间限制在每天 4-5 小时（对比传统编码的 8-10 小时）的报告早在 5 月 2 日就出现并持续整月。Anthropic 的研究发现重度使用 AI 编程代理的开发者调试技能下降了 47%（5月3日），而一位 LinkedIn 工程总监要求其 50 人团队在需要批判性思维的任务中避免使用 AI。美国初级开发者招聘下降了 67%（5月12日），73% 的组织在两年内减少了初级招聘。核心悖论是：有效监督 AI 生成的代码需要的正是因过度依赖 AI 代理而退化的技能。Claude Code 的采用创造了一代"专家级新手"——编码速度快 55% 但无法在没有 AI 的情况下调试——通过代码审查但无法解释自己的工作。Cognition CEO Scott Wu（5月29日）和 Linus Torvalds（5月29日）都强调 AI 是生产力倍增器而非替代品，但初级开发者的结构性人才管道崩塌仍未被任何供应商解决。
AI 辅助开发的经济学从"AI 是免费的"转变为"AI 是投资组合优化问题"，开发者被迫进行成本导向的模型选择。 GitHub 6 月 1 日的使用量计费迁移主导了月末开发者讨论，用户预计重度使用模式下成本将增加 10-100 倍。根本原因是供应商通过固定费率定价鼓励了不加区分的使用（使产生子代理、运行长时间高级请求变得容易），然后改变了计费模型。实际应对正在出现：Factory 将每个查询路由到最便宜的可用模型；GitHub 通过修剪未使用的 MCP 工具和部署每日审计/优化代理实现了 62% 的 token 成本降低（5月29日）；Copilot 的自动模型选择为委托模型选择提供 10% 折扣；Claude Code 的按类别成本分解（/usage）实现了细粒度成本归因。赢家是那些将模型视为投资组合的开发者（Opus 用于架构、Haiku 用于模板代码、GPT-5-mini 用于简单编辑），而非默认选择最昂贵选项的开发者。
多模型代码审查正在成为智能时代的质量保证实践。 开发者 Nolan Lawson 记录了一个结合 Claude 子代理、Codex 和 Cursor Bugbot 并行审查 PR 的工作流，实现了接近零的误报率（5月25日）。GitHub 的 Copilot CLI 发布了 /rubber-duck 命令用于跨模型评审（5月18日）——将 GPT 会话与 Claude 评审者配对，反之亦然。研究表明前沿 LLM 在 67% 的现实世界声明上存在分歧（5月30日）提供了理论基础：如果模型具有根本不同的校准策略，跨模型共识可以识别低置信度输出。Mozilla 的 Claude Mythos 管道通过将模型能力与动态假设测试配对发现了 271 个 Firefox bug 且"几乎零误报"（5月7日）。这种模式——使用竞争模型作为相互验证器——代表了 AI 生成代码最可信的质量保证方法，正在从个人实践快速转变为组织标准。
开发者工具界面碎片化为持久的多平台代理管理，需要新的工作流范式。 到月底，开发者可以通过以下方式与编程代理交互：终端 CLI（Copilot CLI、Claude Code、Codex、Kiro、OpenCode、Antigravity）、桌面应用（GitHub Copilot App、Cursor、Antigravity 2.0）、IDE（VS Code、JetBrains、Eclipse、Xcode）、移动应用（ChatGPT/Codex mobile、GitHub Mobile）、浏览器（Kiro Web、GitHub.com）、协作工具（通过 Cursor 的 Microsoft Teams、Jira、Slack）和自动化触发器（GitHub webhooks、cron 计划、API 调用）。Claude Code 的 Agent View（5月11日）和 GitHub 的统一会话仪表板（5月14日）代表了对连贯多代理管理 UI 的首次尝试。实际上限似乎是开发者能有效监督的 3-5 个并发代理（多个来源指出），推动了编排模式（Symphony、动态工作流）的投资，这些模式在无需持续人类关注的情况下协调代理。
安全成为开发者工作流的一等公民，而非事后关卡。 GitHub MCP Server 的密钥扫描 GA 和依赖漏洞扫描（5月5日）将安全检查直接嵌入智能循环中。Copilot CLI 的 /security-review 命令（5月20日）提供终端漏洞扫描。Claude Code 的自动模式改进了数据泄露检测（5月28日）。Arcjet Guards（5月10日）在代码级别而非网络边界的代理工具处理器内执行策略。然而，根本挑战仍然存在：尽管模型改进，AI 生成代码的安全通过率自 2023 年以来基本持平（5月16日），漏洞利用窗口从数月缩短至数天，NIST 宣布由于提交量激增 263% 将停止丰富大多数 CVE。结构性张力在于 AI 同时加速了漏洞创造（通过带安全缺陷的 AI 生成代码）和漏洞发现（通过 AI 驱动的扫描），将攻防之间的传统成本不对称压缩为双方拥有同等工具的速度竞赛。
开源治理被迫为 AI 代理贡献建立明确边界，形成了政策拼凑格局。 SQLite 正式强化其 AGENTS.md 以拒绝所有智能代码贡献（5月28日），Node.js 因一个重大 AI 辅助 VFS 贡献面临治理危机（5月25日），Linux 内核报告了来自 AI 的 20% 提交增长，"路过式"错误报告让维护者精疲力竭（5月29日）。张力尤为尖锐：Node.js VFS 模块由 Claude Code 构建但提供了关键 AI 基础设施（LangChain 和 Vercel 使用的内存沙箱），迫使 TSC 进行政策投票，其结果将为所有主要开源项目树立先例。与此同时，Pullfrog（由 Zod 创建者 Colin McDonnell 开发）作为开源 AI GitHub bot 推出用于 PR 审查（5月27日），Block 将 Goose 转移至 Linux 基金会的 Agentic AI Foundation（5月15日）以解决治理障碍。新兴模式表明 AI 生成的贡献将需要与人类编写代码不同的审查标准和归因机制，但对这些标准应该是什么尚未形成共识。