May 18, 2026
Key Signals
-
GitHub 集中发布一系列 Copilot 平台扩展,将其编码代理打造为多端协同、更自主的工具。 Copilot CLI 会话远程控制在 Mobile、Web、VS Code 和 JetBrains 全面正式发布(GA),开发者可以在终端启动会话后从任何设备进行监控和引导。同时,GitHub 推出了一键修复失败 Actions 的 Copilot 云代理功能、新增低成本模型(Claude Haiku 4.5、GPT-5.4-mini,0.33x 倍率),并将 Copilot Spaces API 正式发布。这批更新将 GitHub Copilot 从会话绑定的助手定位转变为持久化、随时可用的代理层。 [1][2][3][4]
-
Cursor 发布 Composer 2.5,采用创新 RL 训练技术,标志着自定义训练编码模型的新前沿。 Composer 2.5 基于 Moonshot 的 Kimi K2.5 开源检查点构建,使用定向 RL 文本反馈——在特定错误点插入提示并蒸馏修正行为——以及比前代多 25 倍的合成任务。Cursor 还透露正在与 SpaceXAI 合作,使用 Colossus 2 的百万 H100 等效算力,以 10 倍总计算量从零开始训练一个更大的模型,表明 AI 编码公司正在以前沿规模投资专有模型训练。 [5]
-
OpenAI Codex v0.131.0 推出 Python SDK 品牌重塑、插件市场和守护进程管理的远程控制工作流。 Python SDK 正式迁移至
openai-codex/openai_codex,具备固定运行时生成类型和审批模式;TUI 获得统一的@提及功能,可在一个选择器中搜索文件、目录、插件和技能。新的codex doctor命令提供全面诊断,插件钩子默认启用——反映出 Codex 从独立工具演变为具有一流插件基础设施的可扩展平台。 [6] -
GPT-5.3-Codex 成为 GitHub Copilot Business 和 Enterprise 的首个长期支持(LTS)模型,保证 12 个月可用性。 该模型取代 GPT-4.1 成为所有 Business/Enterprise 组织的基础模型,携带 1x 高级请求倍率,将持续可用至 2027 年 2 月 4 日。GitHub 报告该模型具有"显著高的代码存活率"。LTS 认证为企业内部安全审查提供了所需的稳定性——解决了企业采用 AI 编码工具的关键障碍。 [7]
-
Copilot CLI v1.0.49 新增 /rubber-duck 批评、/chronicle 搜索、持久化记忆管理和 Alpine Linux 支持。 新增实验性功能包括
/mcp search用于从注册表发现和安装 MCP 服务器,以及带延迟加载的工具搜索。/rubber-duck命令调用独立的批评代理来审查当前工作,引入了内置的对抗性审查循环。钩子现在可以正确触发子代理工具调用,CLI 首次支持在 Alpine Linux(musl libc)上运行,扩展了轻量级容器的部署场景。 [8] -
OpenAI 与 Dell 合作将 Codex 引入混合和本地部署的企业环境,解决数据驻留和安全合规要求。 该合作允许组织使用 Dell 的硬件和服务在自有基础设施中运行 Codex,超越了纯云部署。对于无法将代码发送到外部 API 的受监管行业,本地 Codex 部署消除了根本性的采用障碍。 [9]
-
Google 泄露的 "Remy" 代理项目使企业架构师重新思考 AI 技术栈,凸显了自主代理需要持久化工作流运行时。 行业专家认为,一旦代理从请求-响应模式转变为持续运行的委托执行,底层基础设施必须处理重试、部分故障、状态一致性、认证传播和策略执行——将 AI 应用转变为分布式系统。确定性策略引擎和加固的运行时隔离正在成为生产级代理的关键基础设施层。 [10]
AI Coding News
-
Anthropic 的 "Code with Claude 2026" 大会展示了托管代理、顾问/执行器模型策略和 80 倍年化收入增长。 旧金山大会展示了 Claude Code 的新自动模式(分类器驱动的权限决策)、用于隔离分支的工作树、以及在 cron/webhooks 上运行的例程。GitHub CPO Mario Rodriguez 披露 GitHub 在调用 Claude 时的目标缓存命中率为 94% 以上,将提示组装效率视为高频交易。Vercel CEO Guillermo Rauch 报告 Opus 令牌占其 AI 网关使用量的约 20%,但占支出的 70% 以上。Claude 在 SWE-bench Verified 上的得分在过去一年中从 62%(Sonnet 3.7)提升到 87%(Opus 4.7)。 [11]
-
Google 报道中的 "Remy" 项目代表着向可代表用户自主执行操作的 OpenClaw 式代理的转变。 内部文档将其描述为"由 Gemini 驱动的全天候个人代理,用于工作、学习和日常生活",据报道 Remy 正在内部版 Gemini 中测试。该项目强化了长时间运行的自主代理工作流这一新兴模式,基础设施需求包括持久执行图、异步编排和跨多服务的委托权限。银行、医疗和受监管行业正在为关键工作负载采用"军事级隔离"。 [10]
-
OpenAI 与 Dell 宣布合作,将 Codex 部署到混合和本地企业环境。 该合作使组织能够使用 Dell 的企业硬件在自有基础设施中安全运行 AI 编码代理,针对数据驻留要求、安全合规和网络隔离约束——这些因素此前阻碍了部分组织采用纯云 AI 编码工具。 [9]
Feature Update
-
Cursor Composer 2.5 发布,采用定向 RL、25 倍合成任务和双定价层级。 Composer 2.5 在智能和持续长时间任务性能方面相较 Composer 2 有实质性提升。训练创新包括定向文本反馈(在 RL 过程中在特定错误点插入修正提示)、基于真实代码库的特性删除合成任务、以及用于 MoE 模型的分片 Muon 与双网格 HSDP。定价:$0.50/$2.50 每百万令牌(标准)或 $3.00/$15.00(快速,默认)。首周包含双倍使用额度。 [5]
-
GitHub Copilot CLI 远程控制在 Mobile、Web、VS Code 和 JetBrains 全面正式发布。 开发者现在可以在任何终端启动 Copilot CLI 会话,并从 GitHub Mobile、github.com、VS Code 或 JetBrains 实时监控或引导。GA 新增功能:支持非 GitHub 仓库、实时会话流、从移动端审查和编辑计划、处理权限请求、以及用于持久会话的
/keep-alive。使用copilot --remote或会话中/remote on启动。 [1] -
GitHub Copilot 云代理获得一键修复失败 GitHub Actions 作业的能力。 Copilot Business 和 Enterprise 订阅者在工作流运行日志上看到"Fix with Copilot"按钮。点击后触发云代理调查故障、将修复推送到分支并标记用户审查——全部在其自有的云开发环境中完成。设计用于委派测试修复和代码检查修正。 [2]
-
GitHub Copilot 云代理扩展至低成本模型:Claude Haiku 4.5 和 GPT-5.4-mini,0.33x 倍率。 用户现在可以为简单变更选择更小、更快的模型,将更强大的模型保留给复杂工作。两个新模型均携带 0.33x 高级请求倍率,每次请求成本是标准 1x 模型的三分之一。 [3]
-
Copilot Spaces API 正式发布,支持程序化上下文管理。 REST API 允许应用程序创建、读取、更新和删除 Spaces,管理协作者和资源,减少企业大规模管理多个 Spaces 的手动开销。 [4]
-
GPT-5.3-Codex 成为 Copilot Business 和 Enterprise 的基础模型,附带至 2027 年 2 月的 LTS 保证。 这是 Copilot 生态系统中的首个长期支持模型。GPT-4.1 暂时以 0x 倍率保留,直到 2026 年 6 月 1 日随按量计费上线而弃用。仅适用于 Business 和 Enterprise 计划。 [7]
-
Copilot CLI v1.0.49-6 预发布版搭载 /rubber-duck、/chronicle 搜索、/memory 管理和 MCP 注册表搜索。 主要新增:
/rubber-duck用于独立批评代理工作、/chronicle search用于搜索所有会话内容、/memory on|off|show用于持久化记忆控制、copilot plugin update --all用于批量插件更新、Alpine Linux(musl libc)支持、以及实验性/mcp search用于从注册表发现 MCP 服务器。钩子现在可以正确触发子代理工具调用。 [8] -
OpenAI Codex v0.131.0 提供统一 @ 提及、Python SDK 品牌重塑、插件市场 CLI 和
codex doctor诊断。 TUI 现在显示混合令牌使用量、权限/审批模式和响应式 Markdown 表格。远程工作流获得守护进程管理的codex remote-control,具备运行时启用/禁用 API。Windows 沙箱加固解决了拒绝读取规则、作用域写入根目录和 PowerShell 边缘情况。扩展系统进行了重大重构,引入共享工具契约和记忆扩展管道。 [6] -
OpenCode v1.15.5 预览原生 OpenAI 运行时路径并添加 --replay 会话历史功能。 实验性标志启用原生 OpenAI 运行时路径,
--replay和--replay-limit在恢复交互式运行时显示近期历史。Bug 修复涉及插件工具完成、事件订阅竞态和会话列表排序。桌面改进包括通知、使用量对话框和更快的会话时间线。 [12] -
Gemini CLI v0.44.0-nightly.20260518 添加 ADK 代理会话子代理支持。 每夜构建版引入
adk.agentSessionSubagentEnabled标志,启用 Agent Development Kit 会话级子代理能力。这是 v0.43.0-preview.0 和即将到来的稳定版之间的单功能每夜构建。 [13]