AI Coding News

March 19, 2026

Key Signals

Cursor 发布 Composer 2，一个前沿级专有编码模型，以极低价格碾压竞争对手。 Composer 2 在 Terminal-Bench 2.0 上取得 61.7% 的成绩——超越 Anthropic Opus 4.6（58.0%）——定价仅为 $0.50/M 输入和 $2.50/M 输出 token，远低于 Opus（$5/$25）或 GPT-5.4（$2.50/$15）。核心技术创新是"自我摘要"（self-summarization），一种在循环中进行压缩的强化学习技术，将上下文压缩错误降低 50%，使模型能够在长时间跨度的编码任务中保持连贯性。这是五个月内的第三代 Composer，标志着 Cursor 从 IDE 包装器向模型开发者的快速转型。 [1][2]
OpenAI 收购开发者工具初创公司 Astral，加速 Codex 增长。 Astral 是 Ruff 和 uv 等热门 Python 工具的开发商，将加入 OpenAI 为 Codex 中的下一代 Python 开发者工具提供支持。Codex 目前每周服务超过 200 万用户，自 1 月以来用户增长了三倍，此次收购表明 OpenAI 正通过垂直整合开发者工具来深化其编码助手生态系统的战略。 [3][18]
GitHub Copilot 编码代理获得重大性能和可观测性升级。 Copilot 编码代理启动速度提升 50%，直接缩短了开发者创建和迭代 Pull Request 的反馈循环。与此同时，新的会话日志改进提供了内置设置步骤、自定义环境配置和子代理委派的可见性——反映出代理工作流日益复杂，子代理编排正成为一等公民。 [4][5]
Claude Opus 4.6 在短短两周内发现了 Firefox 的 22 个安全漏洞，其中 14 个被评为高严重性。 这几乎占 2025 年全年 Firefox 高严重性漏洞修复数量的 20%，Claude 还为其中两个漏洞编写了可用的利用代码。Mozilla 验证了这些发现并在 Firefox 148 中发布了修复。Anthropic 警告，AI 漏洞发现与利用能力之间的差距正在迅速缩小，凸显了防御方将 AI 辅助安全分析整合到工作流中的紧迫性。 [6]
AI 行业正从浏览器代理转向编码/终端代理作为主要的智能体范式。 Google 正在重组其 Project Mariner 浏览器代理团队，将计算机使用能力整合到包括 Gemini Agent 在内的更广泛代理战略中。基于终端的编码代理（如 Claude Code 和 OpenClaw）已被证明比基于截图的浏览器代理效率高 10–100 倍，从根本上改变了 AI 实验室的投资方向。OpenAI 希望 Codex 成为 ChatGPT 内通用代理的驱动力，而 Anthropic 已推出 Claude Cowork 作为非终端衍生产品。 [7]
企业 AI 采用数据揭示顶级采用者与落后者之间的鸿沟正在扩大。 Jellyfish 对 700 多家公司、20 万名工程师和 2000 万个 Pull Request 的研究显示，64% 的公司现在使用 AI 辅助生成大部分代码，顶级四分位的采用者 PR 吞吐量翻倍。然而，完全自主的代理活动仍然较低但呈指数增长，第 90 百分位的公司 AI 工具采用率同比增长约 7 倍，而最低四分位几乎为零。 [8]
MCP（模型上下文协议）正在推动企业 API 战略的根本性重构。 摩根士丹利在 QCon London 上介绍了 MCP 如何在 18 个月内从默默无闻发展为行业标准，迫使该公司重新设计其五年 API 计划。将 MCP 工具扩展到少量之上会产生歧义问题，导致代理混淆并浪费 token，推动行业向具有业务上下文感知能力的专用 MCP 网关发展——这是对传统"哑管道"API 网关理念的一次转变。 [15]

AI Coding News

OpenAI 发表关于使用思维链分析监控内部编码代理错位行为的研究。 该研究聚焦于分析真实编码代理部署中的错位模式，并检测新出现的风险以加强 AI 安全保障。这项研究在编码代理日益自主、能够以最少人工监督执行复杂多步骤工作流的关键时刻发布。 [14]
AI 编码模型面临通用基准无法捕捉的结构性"陈旧"问题。 在 QCon London 2026 上，Jeff Smith 指出，基于过时公共仓库快照训练的 AI 模型在遵循管理各个代码库的非书面架构和流程规则方面始终表现不佳。尽管 AI 生成的贡献量激增，PR 接受率实际上已经下降。Smith 提出了"仓库指纹"方案——系统性提取和记录仓库特定约束——以弥合通用模型能力与生产级代码生成之间的差距。 [16]
AI 行业向编码代理的转型正在重塑各大 AI 实验室的竞争格局。 Google 正在重组其 Chrome 浏览器代理项目 Project Mariner，因为势头正决定性地转向基于终端的编码代理。浏览器代理的采用令人失望——Perplexity 的 Comet 每周仅有 280 万用户，OpenAI 的 ChatGPT Agent 降至 100 万以下——而编码代理已成为更可靠、更高效的范式。各 AI 实验室现在正竞相将编码代理从开发者用例扩展到通用助手。 [7]
一篇实用教程展示了使用 Claude Code 与 Marp 进行 AI 辅助演示文稿创作的工作流。 该工作流使用 Claude Code 技能中的 /create-marp-deck 斜杠命令来访谈用户的演示目标、生成结构化 Marp Markdown 草稿，并通过对话或直接编辑迭代完善。该技能兼容 Claude Code、Cursor、GitHub Copilot 及其他 AI 代理，说明代理技能正在跨平台实现可移植。 [17]

Feature Update

Cursor Composer 2 作为前沿级编码模型发布，具有行业领先的成本效率。 定价为 $0.50/M 输入和 $2.50/M 输出 token（快速版本为 $1.50/$7.50），Composer 2 在 CursorBench 上达到 61.3，Terminal-Bench 2.0 上达到 61.7，SWE-bench Multilingual 上达到 73.7——较 Composer 1.5（44.2、47.9、65.9）有大幅提升。性能提升源于 Cursor 首次的继续预训练运行，结合"自我摘要"技术——一种在循环中进行压缩的强化学习方法，训练模型将自身上下文压缩至约 1,000 个 token 同时保留关键信息，将压缩错误降低 50%。 [1][2]
GitHub Copilot 编码代理启动速度提升 50%。 此优化缩短了 Copilot 云端开发环境的启动时间，加速了使用 @copilot 提及或 Agents 标签时的 Pull Request 创建和迭代周期。这对将 Copilot 编码代理作为日常审查迭代工作流一部分的开发者尤为重要。 [4]
GitHub 通过三项关键改进提升了 Copilot 编码代理会话的可见性。 会话日志现在显示内置设置步骤（仓库克隆、代理防火墙初始化）、来自 copilot-setup-steps.yml 的自定义设置步骤输出，以及带实时状态的可折叠子代理活动面板。这些可观测性改进满足了编码代理工作流日益复杂并涉及多代理编排的需求。 [5]
Copilot SDK v0.1.33-preview.3 新增 OpenTelemetry 追踪、blob 附件和 CJS 兼容性。 所有四种 SDK 语言（TypeScript、C#、Python、Go）现在支持分布式追踪，在会话操作间传播 W3C 追踪上下文。新功能包括用于内联 base64 数据的 blob 附件类型、用于模型切换的 reasoningEffort 参数、用于低风险工具的 skipPermission 标志，以及修复 VS Code 扩展兼容性的 Node.js CommonJS 构建。 [10]
Claude Code v2.1.80 发布，带来 MCP 通道预览、并行工具修复和内存优化。 此版本新增 --channels（研究预览）允许 MCP 服务器向会话推送消息，修复了 --resume 丢弃并行工具结果的问题，并在 25 万文件仓库上减少约 80 MB 启动内存使用。其他新增包括用于 Claude.ai 使用量跟踪的 rate_limits 状态栏字段、通过 settings.json 内联声明插件市场，以及技能和斜杠命令的 effort 前置元数据。 [11]
Copilot CLI v1.0.9 解决了 SSH 断连噪音问题并新增 gitignored 文件搜索。 SSH 断开连接或终端关闭时不再显示虚假的 I/O 错误消息（ENOTCONN、EIO）。新增 include_gitignored 配置选项使 @ 文件搜索包含被 gitignore 的文件，修复了 WSL 上的 CJK 文本复制问题，市场/插件的短链接安装现在也能正常工作。 [9]
OpenAI Codex 0.116.0 新增设备码登录、插件安装提示和用户提示钩子。 app-server TUI 现在支持 ChatGPT 设备码引导和 token 刷新。插件设置更加顺畅，新增安装引导、已配置建议白名单和安装/卸载状态的远程同步。新的 userpromptsubmit 钩子允许在执行前阻止或增强提示。实时会话现在以最近的线程上下文开始，且不易出现音频自我中断。 [12]
Gemini CLI v0.35.0-preview.2 作为补丁版本发布。 此次小版本发布将一个定向修复 cherry-pick 到 v0.35.0-preview.1 分支。之前的每日构建版（v0.36.0）包含更多实质性变更，如进程生成工具的沙箱集成、子代理支持和 disableAlwaysAllow 安全设置。 [13]