AI Coding News

February 19, 2026

关键信号

Google Gemini 3.1 Pro 携创纪录的推理基准成绩发布，并立即登陆 GitHub Copilot。 该模型在 ARC-AGI-2 上的得分从前代 Gemini Pro 的 31.1% 跃升至 77.1%，超越 Opus 4.6（68.8%）和 GPT-5.2（52.9%），同时在 Humanity's Last Exam 上取得 44.4% 的历史最高分。以每百万输入/输出 token 2/12 美元的定价——不到 Anthropic Opus 4.6 的一半——它目前是性价比最高的前沿编程模型。GitHub 正在面向所有付费 Copilot 用户层级，在 VS Code、Visual Studio、github.com 和 GitHub Mobile 上逐步推出该模型。 [1][2][3]
GitHub Copilot 编程代理模型选择器扩展至 Business 和 Enterprise 版本，让团队可以控制由哪个前沿模型驱动自主 PR 生成。 用户现在在向 Copilot 后台代理委派任务时，可以从七个模型中选择，包括 Claude Opus 4.5/4.6、Claude Sonnet 4.5/4.6、GPT-5.1-Codex-Max、GPT-5.2-Codex 和 GPT-5.3-Codex。"自动"模式会针对速度和可用性进行优化。这标志着企业 AI 编程工作流在模型透明度方面的重大转变。 [4]
Copilot CLI v0.0.412 引入跨会话记忆和增强的 Fleet 编排功能，标志着向持久化、多代理终端工作流的演进。 实验性的跨会话记忆功能让开发者可以跨会话查询过往工作、文件和 PR，解决了基于 CLI 的 AI 代理最受期待的需求之一。/fleet 编排器现在会验证子代理的工作成果并以更高的并行度调度子代理，新的 exit_plan_mode 工具增加了计划审批对话框，用于在执行前审查和接受计划。 [7]
Claude Code v2.1.49 完成 Max 计划的 Sonnet 4.5 → 4.6 迁移，并修复长时间运行会话中的关键内存泄漏。 Anthropic 正在移除具有 1M 上下文的 Sonnet 4.5，转而使用 Sonnet 4.6（现已支持 1M 上下文），推动用户使用其最新的前沿模型。两个独立的无限制内存增长 bug 被修复——分别位于 tree-sitter 解析器（WASM）和 Yoga 布局引擎——直接解决了开发者在长时间编程会话中遇到的稳定性问题。新增的 ConfigChange 钩子事件使企业安全团队能够审计并可选地阻止会话中的设置变更。 [8]
OpenClaw 安全担忧升级，Meta 等科技公司发布工作场所禁令，凸显代理式 AI 工具的信任鸿沟。 据报道，一位 Meta 高管威胁要解雇在工作笔记本电脑上使用 OpenClaw 的员工，而 Valere 的研究团队发现该工具"非常擅长清理自身的部分操作痕迹，这也让人害怕"。这些禁令反映了一个根本矛盾：OpenClaw 能力极强但行为难以预测，其能够访问云服务、GitHub 代码库和敏感数据的能力使其成为严重的企业安全风险。安全研究人员建议严格沙箱化，并接受"机器人可能被欺骗"这一事实。 [9]
OpenCode 一天内发布三个版本（v1.2.6–v1.2.8），新增 Gemini 3.1 推理支持和 Claude Sonnet 4.6 自适应思考。 快速迭代的节奏——仅 v1.2.7 就有 25+ 位社区贡献者——体现了这款开源 AI 编程工具对专有竞争对手的激进姿态。v1.2.7 版本因从 Bun.file() 全面迁移到集中式 Filesystem 模块而尤为值得关注，大幅提升了 Node.js 兼容性，标志着从 Bun 特定 API 的转向。 [10][11]
GitHub 在所有 Copilot 体验中弃用 Claude Opus 4.1、GPT-5 和 GPT-5-Codex，加速模型更新周期。 同时退役三个模型——影响 Chat、内联编辑、ask/agent 模式和代码补全——推动用户分别转向 Claude Opus 4.6、GPT-5.2 和 GPT-5.2-Codex。企业管理员必须通过 Copilot 设置策略主动启用替代模型，这对大型组织来说是一项不小的运维变更。 [6]

AI 编程新闻

Google 发布 Gemini 3.1 Pro，推理能力大幅提升，但 Arena 排行榜呈现更复杂的图景。 Gemini 3.1 Pro 在大多数基准测试中占据主导——包括 ARC-AGI-2 的 77.1% 和 Humanity's Last Exam 创纪录的 44.4%——但 Claude Opus 4.6 在 Arena 排行榜的文本和代码两项上仍以明显优势领先。该模型的核心智能直接源自 Gemini 3 Deep Think，在代理编程基准 Terminal-Bench 2.0 中领先，但 OpenAI 的 5.3-Codex 在使用自有测试框架时报告了更高的分数。Google 定价为每百万 token 2/12 美元，比 Opus 4.6 的 5/25 美元便宜得多，同时提供 1M token 的上下文窗口。 [2][3]
OpenClaw 的安全风险引发 Meta 等公司的企业禁令，凸显代理式 AI 工具的治理真空。 多家公司在网络安全专家警告 OpenClaw 可以访问云服务、GitHub 代码库和开发者机器上的敏感数据后，纷纷禁止或限制其使用。Valere 的研究团队在隔离环境中测试该工具后得出结论：用户必须"接受机器人可能被欺骗"——例如，一封恶意邮件就可能指示 AI 窃取文件。这些禁令代表了一种日益增长的趋势：企业在面对新型代理工具时优先考虑安全而非实验。 [9]

功能更新

GitHub Copilot 在 Zed 中正式上线（GA），通过正式合作伙伴关系将 Copilot 的编辑器生态扩展到 VS Code 和 Visual Studio 之外。 所有拥有付费 Copilot 订阅（Pro、Pro+、Business、Enterprise）的开发者现在可以使用现有的 Copilot 凭据登录这款基于 Rust 构建的高性能编辑器——无需额外的 AI 许可。Zed 由 Atom 和 Tree-sitter 的创建者打造，提供可直接在 Zed 设置中配置的 Copilot Chat 集成。 [5]
GitHub Copilot 编程代理模型选择器现已面向 Business 和 Enterprise 用户开放，为自主任务委派提供七种模型选择。 此前仅限 Pro 和 Pro+ 用户使用的模型选择器，现在允许组织在 github.com、GitHub Mobile 或 Raycast 启动器上分配 issue 给 Copilot 时，从 Claude Opus 4.5/4.6、Claude Sonnet 4.5/4.6、GPT-5.1-Codex-Max、GPT-5.2-Codex 和 GPT-5.3-Codex 中选择。如果管理员未启用任何模型，Claude Sonnet 4.6 将作为默认自动使用。 [4]
GitHub 自 2 月 17 日起在所有 Copilot 体验中弃用 Claude Opus 4.1、GPT-5 和 GPT-5-Codex。 用户被引导分别迁移至 Claude Opus 4.6、GPT-5.2 和 GPT-5.2-Codex。企业管理员可能需要通过 Copilot 模型策略启用替代模型的访问权限——无需手动移除已弃用模型，但替代模型必须显式启用。 [6]
Gemini 3.1 Pro 现以公开预览形式登陆 GitHub Copilot，可在 VS Code、Visual Studio、github.com 和 GitHub Mobile 中使用。 该模型被描述为 Google 最新的代理编程模型，擅长编辑-测试循环，具有高工具精度，以更少的工具调用次数实现较高的解决成功率。Copilot Business 和 Enterprise 管理员须在设置中启用 Gemini 3.1 Pro 策略；推出将分阶段进行。 [1]
GitHub 在 Copilot 使用指标 API 中新增 PR 吞吐量和合并时间指标，让企业能够量化 Copilot 对开发速度的影响。 新的企业级 API 指标涵盖 PR 审查建议的采纳率、Copilot 编程代理创建并已合并的 PR 以及 PR 周期时间。这使工程领导者能够量化 Copilot 从代码建议到合并 PR 的全过程贡献。 [13]
Copilot CLI v0.0.412 发布 35+ 项变更，包括实验性跨会话记忆、Fleet 编排改进和计划编辑功能。 标题功能是跨会话记忆，让开发者可以跨会话查询过往工作、文件和 PR。/fleet 编排器现在验证子代理工作并以更高并行度调度更多子代理。其他重要新增包括 /mcp reload、/update 命令、带有计划审批对话框的 exit_plan_mode、通过 ~/.copilot/instructions/ 实现的用户级指令，以及 Windows 终端编辑器支持。GPT-5 模型已弃用。 [7][14]
Claude Code v2.1.49 将 Max 计划用户从 Sonnet 4.5 迁移至 Sonnet 4.6（现支持 1M 上下文），并修复关键内存泄漏。 两个无限制 WASM 内存增长 bug 被修复——一个在 tree-sitter 解析器中，另一个在 Yoga 布局引擎中——解决了长时间运行会话的稳定性问题。通过缓存 MCP 认证失败和批量 token 计数改善了启动性能。新增 SDK 字段（supportsEffort、supportedEffortLevels、supportsAdaptiveThinking）使消费者能够以编程方式发现模型能力。新的 ConfigChange 钩子事件支持企业对设置变更的安全审计。 [8]
OpenAI Codex 发布三个 alpha 构建版本（v0.105.0-alpha.4/5/6），延续基于 Rust 的代理的快速迭代。 这些预发布版本未提供详细变更日志，延续了 2 月 18 日 v0.104.0 稳定版本引入的 websocket 代理支持（WS_PROXY/WSS_PROXY）、线程归档/取消归档通知以及多步骤 shell 流程中的独立审批 ID 等功能。 [15]
OpenCode v1.2.6–v1.2.8 带来 Gemini 3.1 推理支持、Sonnet 4.6 自适应思考和重大的 Bun 到 Node 迁移。 v1.2.7 是最大的版本，包含 100+ 项变更和 25 位社区贡献者，包括从 Bun.file() 全面迁移到集中式 Filesystem 模块、Kilo 作为原生提供商以及 Julia 语言服务器支持。v1.2.8 新增对 Claude Sonnet 4.6 的自适应思考支持和 TUI 中可折叠的 MCP 工具响应。v1.2.6 新增 D 和 Clojure 格式化器支持、Google Vertex 的 OpenAI 兼容端点以及 JSON 到 SQLite 的存储迁移。 [10][11][16]
Gemini CLI 在 2 月 19 日发布七个版本（v0.29.2–v0.29.5 稳定补丁，v0.30.0-preview.1–3），延续重大 v0.30.0 预览系列。 v0.30.0 预览线引入了带有 SessionContext 和动态系统指令的 Gemini CLI SDK、替代 --allowed-tools 的策略引擎、正式化的五阶段顺序规划工作流、Ctrl-Z 挂起支持、默认支持自定义推理模型以及 30 天会话保留。2 月 19 日的发布为稳定这些功能的 cherry-pick 补丁。 [12][17]