AI Coding News

February 25, 2026

关键信号

GitHub Copilot CLI 正式发布（GA），从终端助手进化为完整的智能体开发环境。 自 2025 年 9 月公开预览以来，该工具已发布数百项改进，包括计划模式、自动驾驶模式、内置专用智能体、云端后台编码代理委派，以及对 Claude、GPT 和 Gemini 系列的多模型支持。凭借 MCP 服务器、插件、自定义智能体和技能文件的可扩展性，加上组织策略和代理支持等企业级功能，Copilot CLI 现已成为市场上功能最完备的终端原生 AI 编程智能体。 [1][2]
GPT-5.3-Codex 现已在 GitHub 全平台正式可用，将最强大的 OpenAI 编程模型扩展至所有付费 Copilot 层级。 该模型可在 github.com、GitHub Mobile、Visual Studio Code 和 Visual Studio 的 Copilot Chat 中使用，Business 和 Enterprise 管理员需通过策略设置选择启用。这一广泛推出表明 GitHub 对该模型生产就绪性的信心，让开发者无需离开 Copilot 生态即可使用最先进的推理模型。 [3]
Anthropic 收购计算机操控 AI 初创公司 Vercept，继 12 月收购 Bun 之后继续大力扩展智能体能力。 Vercept 募集了 5000 万美元资金，构建了基于云的计算机操控智能体，包括一款可远程操作 MacBook 的产品，此次收购将 Allen Institute for AI 背景的核心 AI 研究人员带入 Anthropic。这一收购凸显了构建能与完整计算环境交互的可靠 AI 智能体已成为前沿模型公司的核心战略优先事项。 [4]
Google 推出 Developer Knowledge API 及配套 MCP 服务器，至此三大云厂商均已提供官方 MCP 端点供 AI 编程工具使用。 该 API 提供对 Google 开发者文档的机器可读访问，平台更新后不超过 24 小时即可重新索引，解决了 AI 助手针对已弃用 API 生成代码的持久问题。随着 AWS Knowledge MCP 和 Microsoft Learn MCP 已先后上线，MCP 正在巩固其作为连接 AI 智能体与实时数据源标准协议的地位——正如十年前 REST 成为 HTTP API 标准一样。 [5]
Google Conductor 为 Gemini CLI 新增自动化代码审查功能，可根据代码库的规范生成实施后合规报告。 行业专家警告"幻觉依赖"（slopsquatting）风险——AI 智能体可能虚构包名，而攻击者随后以恶意包发布——并呼吁在拉取请求阶段保持人类在环监督。此更新反映了企业场景下向以"指令遵循度"作为 AI 治理关键可靠性指标的更广泛转变。 [6]
在 AI 时代，完善的测试套件正成为商业开源项目最有价值——同时也最脆弱——的资产。 一篇在开发者社区引起关注的文章指出，完善的 API 文档和全面的测试现在已成为 AI 驱动复制的蓝图，并以 Cloudflare 利用 Vercel 自身测试快速创建 Next.js 替代方案为例。SQLite 长期将其 9200 万行测试套件保持闭源的做法被视为前瞻性防御策略，预计将有更多商业开源项目效仿。 [7]

AI 编程新闻

Anthropic 收购了总部位于西雅图的初创公司 Vercept，该公司构建了云端计算机操控智能体，联合创始人 Kiana Ehsani、Luca Weihs 和 Ross Girshick 加入 Anthropic。 这家获得 5000 万美元融资的初创公司的产品 Vy——一款可操作远程 Apple MacBook 的计算机操控智能体——将于 3 月 25 日停止服务。此交易引发了联合创始人 Oren Etzioni 与主要投资人 Seth Bannon 之间的公开争论，凸显了 AI 初创生态系统中有前景的团队被前沿模型公司迅速吸收的高风险博弈。 [4]
Google 的 Developer Knowledge API 及 MCP 服务器进入公开预览，为 AI 工具提供对 Google 官方文档的程序化、机器可读访问。 该 API 提供两个核心功能——SearchDocumentChunks 用于基于查询的检索，GetDocument 用于获取完整页面内容——并在 developerknowledge.googleapis.com/mcp 提供远程托管的 MCP 服务器。实际意义在于 Gemini CLI 和 Antigravity 等 AI 助手现在可以实时查询权威文档，而非依赖过时的训练数据，Google 计划在正式发布前添加结构化内容并缩短重新索引延迟。 [5]
Google Conductor 为 Gemini CLI 推出的新自动化审查扩展可通过解读代码库的规范和指南来生成代码质量与合规报告。 该上下文驱动开发扩展使用持久化、版本控制的 Markdown 文件作为规范，并可扫描已有项目以从现有模式生成种子文件。安全专家建议将 AI 智能体视为"高权限内部人员"，赋予其限定范围的身份、最小权限，以及不可协商的审计追踪，以缓解包括幻觉依赖攻击在内的风险。 [6]
随着 AI 智能体成为数据库的主要用户，数据库架构必须从根本上演进，将速度、弹性临时性和隔离性置于传统以人为中心设计之上。 The New Stack 的一篇分析指出，智能体会产生剧烈的活动峰值并在任务完成后丢弃工作空间，使得写时复制分支和计算存储分离成为必需。Manus AI 平台在 TiDB Cloud 上的实践——智能体分叉数据库、并行运行实验并独立提交结果——展示了新兴的"智能体数据库架构"模式。 [8]
一份关于"AI 编程循环"的实践指南提出了通过规则、示例和测试引导 AI 代码生成的 7 步工作流程，取代一次性提示。 作者以 Node.js 购物车为例，展示了服务端验证和测试驱动开发如何发现 AI 生成代码中的隐藏错误——例如 AI 接受客户端发送价格导致的价格篡改漏洞。核心观点是：在 AI 时代，开发者的价值在于清晰定义问题、将其分解为可验证的小单元，并通过测试证明正确性。 [9]
一篇详尽的教程介绍了如何使用 LangChain、EODHD API 和 Streamlit 构建 LLM 驱动的市场分析助手 MVP，将股票问题转化为结构化市场简报。 该架构将引擎与 UI 层清晰分离，使用 ReAct 风格的智能体让 LLM 决定调用哪些数据工具后再生成简报，数据来自真实价格、基本面和新闻。该指南展示了"工具支撑的 LLM 应用"这一新兴模式——AI 仅在检索到经过验证的数据后才生成文本，避免了纯 LLM 回答的幻觉风险。 [10]
一篇文章认为，在 AI 时代，完善的开源 API 文档和全面的测试套件反而使竞争对手更容易用 AI 克隆项目，Cloudflare 快速复制 Next.js 就是典型案例。 Cloudflare 通过让 AI 读取 Vercel 的文档和测试，实现了 94% 的 Next.js API 覆盖率，包含 1,700 个 Vitest 测试和 380 个 Playwright 测试——其成果已部署在美国政府网站上。作者指出 SQLite 保持 9200 万行闭源测试套件的做法将成为更多商业开源项目防止 AI 加速复制的典范。 [7]

功能更新

GitHub Copilot CLI v0.0.418 为正式 GA 版本，标志着从公开预览到面向所有付费 Copilot 订阅者正式发布的里程碑。 此版本包含防止智能体意外自杀的保护措施、移除 --disable-parallel-tools-execution 标志以及修复插件智能体文件路径加载问题。前一个 v0.0.417 版本引入了 /research 命令用于深度研究并导出报告、修复了 MCP 服务器间歇性加载失败的问题，并确保插件智能体和技能在安装后无需重启即可使用。 [2][11]
GitHub Copilot CLI v0.0.419-0 作为 GA 之后的首个预发布版本发布，延续快速迭代节奏。 虽然此版本没有包含详细的更新日志，但其与 GA 版本同日发布表明团队致力于为即将推出的功能维护快速迭代的预览通道。 [12]
GPT-5.3-Codex 现已在 github.com、GitHub Mobile、Visual Studio Code 和 Visual Studio 的 Copilot Chat 中面向所有付费 Copilot 层级可用。 Copilot Business 和 Enterprise 管理员须在设置中启用 GPT-5.3-Codex 策略后，用户才能通过聊天模型选择器访问该模型。这使 GPT-5.3-Codex 成为 Copilot 生态中与 Claude 和 Gemini 并列的最新高级模型选项。 [3]
GitHub Copilot 现可在 github.com 上利用提交消息生成简洁、描述性的拉取请求标题。 在创建新 PR 或编辑现有标题时，标题字段中会出现 Copilot 按钮。标题质量取决于提交消息的清晰度——像"WIP"或"fix"这样模糊的消息会产生较差的建议，这有助于激励团队养成更好的提交习惯。 [13]
github.com 上的 Copilot Chat 现在对部分 GPT 模型使用模型原生网络搜索，提升了对时事和时效性问题的速度和准确性。 该功能以公开预览形式面向使用 GPT-5.1、GPT-5.1-Codex、GPT-5.1-Codex-Mini、GPT-5.1-Codex-Max 和 GPT-5.2-Codex 的付费订阅者开放，其他模型继续使用 Bing 搜索作为后备。用户可通过设置中的"Copilot 可使用模型原生搜索进行网络搜索"开关选择退出。 [14]
Claude Code 连续发布四个版本（v2.1.53 至 v2.1.58），专注于稳定性、平台修复和扩展 Remote Control 可用性。 v2.1.53 版本解决了多个关键问题，包括输入提交后的 UI 闪烁、批量智能体终止发送单独通知而非聚合通知、Remote Control 优雅关闭时留下过期会话，以及 Windows（值损坏 panic、进程创建、WebAssembly 解释器）和 Linux 上的多个崩溃。后续版本修复了 Windows BashTool EINVAL 错误（v2.1.55）、VS Code 扩展崩溃（v2.1.56），并将 Remote Control 扩展至更多用户（v2.1.58）。 [15][16][17][18]
OpenAI Codex 在 0.106.0 系列中推送了五个 alpha 版本（alpha.1 至 alpha.5），用于其基于 Rust 的终端编程智能体。 这些版本仅有标签而无详细更新日志，表明正在对最终将取代原始 TypeScript 实现的 Rust 重写进行快速迭代。同日多个 alpha 版本的高频发布节奏指向 Codex CLI 下一主要版本的活跃开发。 [19][20]
Gemini CLI v0.30.0 引入了规范化的 5 阶段顺序规划工作流程，默认启用工具输出遮罩，并新增 --policy 标志用于用户自定义策略。 主要改进包括 Ctrl-Z 挂起支持、增强的 vim 键绑定、基于会话的 SDK 工具调用引导、简洁 UI 切换、管理员控制文档以及默认启用的 30 天会话保留策略。此版本还弃用了 --allowed-tools 转而采用新的策略引擎，反映了向更结构化的 AI 智能体行为治理方向的转变。 [21]
Gemini CLI v0.31.0-preview.0 新增只读工具的并行函数调用、MCP 进度更新支持以及 Gemini 3.1 Pro Preview 模型支持。 安全改进包括对 web_fetch 工具进行速率限制以缓解通过提示注入发起的 DDoS 攻击，以及从终端输出中去除欺骗性 Unicode 字符。此版本还将开发工具迁入 monorepo，添加了 macOS 运行事件通知，并通过基于会话的架构重构改进了 SDK。 [22]
OpenCode v1.2.12 和 v1.2.14 带来了进程工具改进、LSP 错误可见性提升和认证修复。 v1.2.12 版本将 Bun.spawn 迁移至带有超时和清理机制的 Process 工具，禁用了 plan enter 工具以防止任务执行期间的意外模式切换，并为 apply_patch 工具添加了 LSP 错误显示。v1.2.14 版本添加了消息删除端点并修复了 TUI 认证登录时的 stdout 消费问题。 [23][24]