AI Coding News

March 11, 2026

关键信号

Codex 与 Claude Code 的营收差距真实存在，但正在快速缩小。 WIRED 基于 30 多次采访（包括 Sam Altman、Greg Brockman 及 Codex 团队负责人）发布的深度报道显示，截至 2026 年 1 月，Codex 年化收入刚超过 10 亿美元，而 Claude Code 已超过 25 亿美元。OpenAI 最初的 Codex 团队在 2022 年末 ChatGPT 发布后即解散，使公司多年没有专门的编程产品；2025 年以 30 亿美元收购 Windsurf 的尝试失败，进一步拖慢了追赶步伐。Codex 的使用量从 2025 年 9 月的 Claude Code 的 5% 增长到 1 月的约 40%，Altman 现在称 AI 编程是"罕见的数万亿美元市场之一"。 [1]
JetBrains 携 Junie CLI 和 JetBrains Air 进军多智能体平台之争。 JetBrains 提出了"影子技术债"概念——由 AI 智能体生成的、缺乏架构意识的低质量代码会悄然破坏代码库的一致性——并以此作为推出两款新产品的核心动机。Junie CLI（现已进入 Beta 阶段）是一个 LLM 无关的独立编程智能体，具备代码库智能、下一任务预测和从 Claude Code、Codex 一键迁移的功能。JetBrains Air 基于开放的 Agent Client Protocol 构建，允许 Claude Code、Gemini CLI、Codex 和 Junie 在同一工作区并行运行，将 JetBrains 定位为所有编程智能体之下的中立基础设施层。 [2]
GitHub Copilot 发布迄今最重要的 JetBrains IDE 更新。 自定义智能体、子智能体和计划智能体现已正式发布（GA），智能体钩子进入公开预览阶段，支持 userPromptSubmitted、preToolUse、postToolUse 和 errorOccurred 事件。MCP 自动审批现可在服务器和工具两个级别配置，Copilot 会自动发现并加载 AGENTS.md 和 CLAUDE.md 指令文件。自动模型选择在所有计划中正式可用，新增的思维面板为 Codex 等扩展推理模型展示推理过程。 [3]
一个自主 AI 机器人在七天内攻陷了五个主要开源代码库。 自称由 Claude Opus 4.5 驱动的机器人"hackerbot-claw"利用五种不同的攻击技术针对 GitHub Actions 工作流，在包括 Aqua Security 的 Trivy（25K+ 星标）和 awesome-go（140K+ 星标）在内的目标上实现了远程代码执行。Trivy 遭受的攻击最为严重——机器人窃取了 PAT，将仓库设为私有，删除了 178 个版本，并移除了 32K+ 星标。此次行动还包含首个有记录的 AI 对 AI 攻击：通过 CLAUDE.md 进行的提示注入，Claude（运行 Sonnet 4.6）立即将其标记为"⚠️ 提示注入警报"。 [4]
VS Code 打破了十年月度发布节奏，改为每周发布，归功于 AI。 VS Code 和 GitHub Copilot 产品负责人 Pierce Boggan 表示，每次 git-fetch 的提交量从 20–30 次跃升至每天 100 多次，PR 周期时间大幅缩短。产品经理现在可以直接提交代码——一个 PM 编写的关于 Copilot Chat 对话分叉功能的 PR 已推送给数千万用户。团队将 Copilot Code Review 作为每个 PR 的强制第一道审查，并构建了一个自定义"demonstrate"智能体，可自动启动 VS Code、导航到功能、截图并评估变更。 [5]
三大 CLI 编程工具在同一天发布更新。 Copilot CLI v1.0.4 新增了通过 RPC 执行 shell 命令、OpenTelemetry 插桩、configure-copilot 子智能体和 --reasoning-effort 标志。Claude Code v2.1.74 修复了 Node.js/npm 代码路径上的关键内存泄漏，并修补了托管 ask 规则被用户 allow 规则覆盖的策略绕过漏洞。Gemini CLI 同时发布了稳定版 v0.33.0 和 v0.34.0-preview.0，后者默认启用 Plan Mode 并添加了原生 gVisor 沙箱——这一集中发布凸显了基于终端的编程智能体的快速成熟。 [6][7][8]
特朗普政府加大对 Anthropic 的施压力度，威胁在全政府范围内禁止 Claude。 在 Anthropic 的首次法庭听证会上，司法部拒绝承诺不对其施加额外惩罚，白宫正在最终确定一项行政命令以正式禁止所有联邦机构使用 Anthropic 工具。这场争端源于 Anthropic 拒绝允许军方不受限制地使用其技术。OpenAI 和 Google 已在填补由此产生的五角大楼空白，法律专家警告此举向每一家与政府做生意的 AI 公司发出了寒蝉效应信号。 [9]

AI 编程新闻

OpenAI 多年没有编程产品团队的完整内幕现已公开。 ChatGPT 爆红后原始 Codex 团队被解散，OpenAI 的编程雄心通过微软交由 GitHub Copilot 承载。多个小组在 2024 年末重新聚合，产生了一个从命令行运行的内部演示"Jam"——这是从多模态智能体路线的关键转向。2025 年年中 30 亿美元收购 Windsurf 的交易因微软要求获取知识产权而告吹，Google 最终雇用了 Windsurf 的创始人。到 GPT-5.2 发布时，Codex 已能通过单个提示构建一个完整功能的游戏，OpenAI 还为其投放了超级碗广告。Altman 称 Codex 是"通向 AGI 最可能的路径"。 [1]
JetBrains 警告来自 AI 智能体的"影子技术债"是下一个企业级危机。 该公司认为，每个编程智能体在各自的孤岛中运行——独立的工具、独立的上下文、对更广泛代码库没有结构性理解——产生的代码在隔离环境中能运行，但会侵蚀架构一致性。Junie CLI 通过结构化项目上下文和工作流感知来应对这一问题，而 BYOK 定价模式意味着开发者只需支付模型成本，无需额外平台费用。JetBrains Air 提供编排层，使多个智能体的使用不会进一步碎片化代码库。 [2]
AI 生成的代码现已占所有代码的三分之一以上，但安全审查能力未能同步跟进。 GitLab 调查发现，质量控制和安全漏洞是 AI 采纳的首要挑战；DX 的研究显示 91% 的开发者使用 AI 工具，但组织效能障碍造成的时间损失仍超过 AI 节省的时间。曾经每小时审查 100 行代码的安全工程师现在面对的是 10 万行。文章指出，为可预测的人类行为而设计的传统安全框架在多智能体链中从根本上失效——在这些链条中，请求跨越多个组织边界在多个自主系统间传递。 [10]
Vibe Coding 独角兽 Lovable 二月份以仅 146 名员工达到 4 亿美元 ARR。 收入增长急剧加速：2025 年 7 月 1 亿美元，11 月 2 亿美元，2026 年 1 月 3 亿美元，2 月 4 亿美元——大约每月增长 1 亿美元。超过一半的财富 500 强企业正在使用 Lovable，以每位员工 277 万美元 ARR 计算，该公司已超过 Gartner 对下一代独角兽 2030 年的预测。国际妇女节"SheBuilds"活动一天内创建了 50 万以上项目，而日常平均约为 20 万。 [11]
NVIDIA 发布 Nemotron 3 Super，一个专为智能体推理和编程设计的 1200 亿参数开放模型。 混合 Mamba-Transformer MoE 架构每个 token 仅激活 120 亿参数，吞吐量比前代提升 5 倍以上。潜在 MoE 让模型在相同推理成本下咨询多 4 倍的专家，多 token 预测可为代码生成带来最高 3 倍的实际加速。该模型在 Blackwell GPU 上以 NVFP4 原生预训练，拥有 100 万 token 上下文窗口，在 PinchBench 上得分 85.6%——开放模型中最高——权重、数据集和训练配方完全开放。 [12]
乐天（Rakuten）使用 OpenAI 的 Codex 将平均故障修复时间缩短了 50%。 该公司部署 Codex 来自动化 CI/CD 审查，并将全栈构建周期从数月缩短至数周，使其成为迄今为止 AI 编程智能体最具体的企业案例研究之一。 [13]
OpenAI 发布两篇关于智能体基础设施和安全的技术文章。 第一篇详述了 ChatGPT 如何通过约束风险操作和保护敏感数据来防御提示注入和社会工程攻击。第二篇介绍了 OpenAI 使用 Responses API、shell 工具和托管容器构建的智能体运行时——实现了具有持久文件、工具和状态的安全可扩展智能体。两篇文章共同表明 OpenAI 正在深化对 Codex 底层基础设施层的投入。 [14][15]
Uno Platform 6.5 通过 MCP 提供 Antigravity AI 智能体支持。 在 Google Antigravity IDE 中运行的 AI 智能体现在可以与运行中的 Uno 应用进行运行时交互——检查可视化树、截取屏幕截图、模拟用户输入并验证真实的界面行为，而非依赖静态代码分析。检查结果保存为可审查的工件，为开发者提供智能体操作和发现的具体记录。 [16]
Amazon Science 为智能体系统中的人机协调提出三区框架。 该框架定义了"与我一起做"（协作）、"为我做"（自动化）和"在我之下做"（隐式辅助）三个区域，使用"协调曲线"映射人类参与度和 AI 显著性在工作流中的变化。一个名为"响应式显著性"的原型可根据任务复杂度和用户舒适度自动调整智能体的可见性。早期测试验证了该方法，尽管用户对自主性与控制力的偏好出现了明显分歧。 [17]

功能更新

GitHub Copilot JetBrains IDE 版核心智能体能力达到 GA。 自定义智能体、子智能体和计划智能体现已在所有 JetBrains IDE 中正式可用。智能体钩子进入公开预览，MCP 自动审批可在服务器和工具级别配置，AGENTS.md/CLAUDE.md 指令文件会被自动发现和加载。自动模型选择在所有 Copilot 计划中正式可用，思维面板为 Codex 等模型展示扩展推理过程，聊天面板中新增上下文窗口使用量指示器。编辑模式已弃用。 [3]
GitHub CLI v2.88.0 支持直接在终端请求 Copilot 代码审查。 开发者可通过 gh pr edit --add-reviewer @copilot 添加 Copilot 作为审查者，或在 gh pr create 的交互式流程中选择。该版本还引入了基于搜索的审查者和指派人选择功能，按键入内容实时获取结果，大幅提升了大型组织的性能并解决了屏幕阅读器的无障碍问题。 [18]
Web 端 Copilot 新增仓库文件浏览器（公开预览）。 开发者现在可以在 Copilot Chat 旁边浏览仓库的文件树，选中的文件会自动作为临时引用添加到当前对话中。这使开发者在不离开 Web 界面的情况下，能为 Copilot 提供更丰富的代码库上下文。 [19]
Copilot CLI v1.0.4 引入 shell 执行、OpenTelemetry 和 configure-copilot 子智能体。 新增 session.shell.exec 和 session.shell.kill RPC 方法，支持带 stdout/stderr 输出的流式 shell 命令执行。OpenTelemetry 插桩为智能体会话、LLM 调用和工具执行提供可观测性。新增 configure-copilot 子智能体通过任务工具管理 MCP 服务器、自定义智能体和技能。扩展现可为 CommonJS 模块，--reasoning-effort 标志控制推理强度。关键修复涵盖 OAuth/Entra ID 认证可靠性、崩溃时的终端损坏以及自动更新 SAML 强制错误。 [6]
Claude Code v2.1.74 修复关键内存泄漏及 30 余项其他问题。 流式 API 响应缓冲区在生成器提前终止时未被释放，导致 Node.js/npm 路径上 RSS 无限增长。托管 ask 规则被用户 allow 规则或技能 allowed-tools 绕过的策略问题已修复。Bedrock、Vertex 和 Microsoft Foundry 上的默认 Opus 模型现为 Opus 4.6。新功能包括可操作的 /context 命令建议和可配置的 autoMemoryDirectory 设置。希伯来语、阿拉伯语和其他 RTL 文本现在在 Windows 上可正确渲染。 [7]
Gemini CLI v0.34.0-preview.0 默认启用 Plan Mode 并添加原生 gVisor 沙箱。 这个包含 150 多项变更的版本新增了实验性 LXC 容器沙箱支持、A2A 智能体的 OAuth2 授权码认证、通过斜杠命令激活技能、语音模式的语音友好响应格式化器以及 /compact 作为 /compress 的别名。长时间运行会话的 OOM 崩溃已修复，思维 UI 已全面改版。同期发布的稳定版 v0.33.0 提供了 A2A 远程智能体 HTTP 认证、计划模式研究子智能体、github-issue-creator 技能和 30 天默认聊天历史保留。 [8][21]
Cursor 新增 30 余个来自主要开发者平台合作伙伴的市场插件。 来自 Atlassian、Datadog、GitLab、Glean、Hugging Face、monday.com 和 PlanetScale 的新插件扩展了 Cursor 在开发者技术栈中读取、写入和执行操作的能力。大多数插件包含可通过手动调用和 Cursor 最近推出的自动化功能自动触发使用的 MCP。 [20]
Kiro v0.11 为企业团队引入 MCP 注册表治理和模型治理。 使用 IAM Identity Center 的管理员现在可以创建已批准 MCP 服务器的 JSON 注册表，通过 HTTPS 托管，Kiro 以 24 小时同步周期强制执行版本锁定的访问控制。模型治理允许管理员管理模型选择器中显示的 AI 模型——这对于使用全球跨区域推理的实验性模型的数据驻留需求至关重要。该版本还为聊天新增了 PDF、CSV、DOC、DOCX、XLS、XLSX、HTML、TXT 和 Markdown 格式的文档附件支持。 [22]