AI Coding News

March 5, 2026

关键信号

  • OpenAI 发布 GPT-5.4,当天即在 GitHub Copilot 及整个 AI 编程生态系统中全面上线。 GPT-5.4 是 OpenAI"最强大且最高效的前沿模型",融合了 GPT-5.3-Codex 的编程优势以及更强的推理、工具选择能力,同时 100 万 token 上下文窗口正式脱离 Beta。与 GPT-5.2 相比,响应中出现错误的概率降低 18%,单个事实性声明出错概率降低 33%,新增的 Thinking 模式会先展示思考计划,允许用户在模型推理过程中进行引导。GitHub 立即在 VS Code、Visual Studio、JetBrains、Xcode、Eclipse、github.com、Mobile、CLI 和 Coding Agent 中同步提供 GPT-5.4,堪称 Copilot 生态系统中最快的模型上线速度之一。 [1][2][3]

  • Cursor 推出 Automations(自动化)框架,支持事件驱动的常驻编程 Agent,与此同时其年收入据报翻倍至超过 20 亿美元。 Automations 允许工程师通过 Slack 消息、GitHub PR、PagerDuty 事件、Linear 工单、定时任务或自定义 Webhook 触发 Agent——每个 Agent 在独立云沙箱中运行,使用配置好的 MCP 和模型。Cursor 内部每小时已运行数百个自动化任务,涵盖安全审查、智能代码责任人分配、事件响应和测试覆盖率生成。此次发布正值彭博社报道 Cursor ARR 在三个月内翻倍、Ramp 数据显示其在生成式 AI 客户中占据约 25% 的市场份额,进一步巩固了其在日趋激烈的 Agent 编程竞争中的地位。 [4][5][6]

  • GitHub Copilot 编程 Agent 通过 Jira 集成(公开预览版)和 Agent 化代码审查(正式发布)扩展其覆盖范围。 开发者现在可以将 Jira 工单直接分配给 Copilot 编程 Agent,它会分析工单描述、自主实现变更并打开 PR 草稿——打通了项目管理与 AI 驱动开发之间的壁垒。另外,Copilot 代码审查现已运行于全新的 Agent 化工具调用架构之上,能够获取更广泛的仓库上下文,提供质量更高、噪声更低的审查意见。这两项更新体现了 GitHub 将自主 Agent 更深度嵌入现有企业工作流的战略方向。 [7][8]

  • "Clinejection" 供应链攻击揭示了一个 GitHub Issue 标题中的提示注入如何导致 4,000 台开发者设备被入侵,并被植入未授权的 AI Agent。 攻击者在 Cline 的 Issue 标题中嵌入恶意指令,其 AI 分流机器人(使用 claude-code-action)将指令作为合法操作执行,导致 GitHub Actions 缓存投毒、NPM/VSCE/OVSX 凭证被盗,以及恶意 npm 发布——在开发者机器上悄无声息地安装了 OpenClaw。这条从自然语言注入到"AI 引导安装 AI"的攻击链,对 CI/CD 流水线中自动化 AI 工作流的安全性提出了紧迫的质疑。Cline 此后已采用 OIDC 来源证明进行 npm 发布,并从凭证处理工作流中移除了缓存使用。 [9]

  • AI 编程助手正在制造"便利循环",重塑编程语言的采用格局。 GitHub Octoverse 2025 数据显示 TypeScript 同比增长 66%,以 263.6 万月活贡献者超越 Python 和 JavaScript 成为 GitHub 最受欢迎的语言。其机制是:当 AI 使某种技术变得无摩擦,开发者便会蜂拥而至,产生更多训练数据,进而让 AI 更擅长该技术——这种自我强化循环可能加速生态系统向对 AI 友好的语言集中。 [10]

  • Claude Code、Codex、Gemini CLI、OpenCode 和 Kiro 在同一天同步发布重大版本。 Claude Code v2.1.69 包含 80 余项变更,新增 /claude-api 技能、10 种新语音 STT 语言及关键安全修复。Codex 连发两个版本(v0.110.0 和 v0.111.0),引入插件系统、多 Agent TUI 和默认快速模式。Gemini CLI 夜间版新增实验性 LXC 容器沙箱和循环检测。OpenCode 发布两个版本,主打 Ghostty 分支桌面终端。Kiro v0.10.78 新增实时上下文用量横幅。这种同步密集发布的节奏,彰显了竞争的加剧。 [11][12][13][14][15][16]

AI 编程新闻

  • GPT-5.4 提供 Thinking($2.50/$15 每百万输入/输出 token)和 Pro($30/$180)两个版本,成为 OpenAI 有史以来最昂贵的模型——尽管公司声称更高的 token 效率可以抵消价格上涨。 在 SWE-Bench Pro 上,GPT-5.4 Thinking 同时击败了 Codex 和 Google Gemini 3.1 Pro,在 GDPval 上得分 83%——在 44 个职业中匹配或超越行业专业人士。Pro 版本仅在 ChatGPT 和 API 中提供(不含 Codex),在 FrontierMath 最高难度问题上达到 38%。Batch 和 Flex 定价为标准价的一半,Priority 处理为两倍,为团队提供了精细化的成本控制。 [3]

  • AI 不会取代开发者,但"自给自足型开发者"模式要求比以往更深的跨领域专业知识。 GitLab 研究发现 83% 的 DevSecOps 从业者认为 AI 将在五年内显著改变其角色,但 76% 认为 AI 会创造更多工程师岗位而非减少。"不再需要初级开发者"的论点忽略了一个事实:仍然需要有人审查、验证 AI 输出并为其承担责任——而培养这种判断力需要协作工程文化,而非仅仅是更好的工具。 [17]

  • Nanocode——一个用于构建自定义 AI 编程 Agent 的开源项目在 Reddit r/coding 社区引发关注。 该项目允许开发者创建完全可定制的 AI 编程 Agent,适配特定的工作流和偏好,反映了社区对商业 Agent 编程平台之外的"自建方案"日益增长的兴趣。 [18]

  • OpenAI 同时宣布推理模型难以控制其思维链(Chain of Thought),但将此视为增强可监控性的正面安全属性。 公司在 GPT-5.4 发布的同时推出了 CoT-Control 研究,发现推理模型无法完全操控其思维轨迹,使隐藏推理更容易被检测——这对于日益依赖扩展推理的 Agent 编程工具而言是一项重要考量。 [19]

功能更新

  • GitHub Copilot 在全平台新增 GPT-5.4 模型支持。 OpenAI 最新的 Agent 编程模型 GPT-5.4 现可在 VS Code(v1.104.1+)、Visual Studio(17.14.19+)、JetBrains(1.5.66+)、Xcode(0.48.0+)、Eclipse(0.15.1+)、github.com、GitHub Mobile、GitHub CLI 和 GitHub Copilot Coding Agent 的模型选择器中选用。Enterprise 和 Business 管理员需在 Copilot 设置中启用 GPT-5.4 策略。 [1]

  • GitHub Copilot 编程 Agent 的 Jira 集成进入公开预览。 开发者可将 Jira 工单分配给 Copilot 的自主编程 Agent,它会分析工单描述和评论、实现变更、打开 PR 草稿、在 Jira 中发布进度更新,并在需要时提出澄清问题。该集成需要启用了 Rovo 的 Jira Cloud,并支持 GitHub 数据驻留客户。 [7]

  • Copilot 代码审查现运行于 Agent 化工具调用架构之上(正式发布)。 新架构能获取更广泛的仓库上下文——包括相关代码、目录结构和引用,产出更高质量的审查意见,优先关注正确性和架构完整性,同时降低噪声。它运行在 GitHub Actions 上;使用自托管 Runner 的组织需完成一次性配置。 [8]

  • GitHub 新增 Agent 会话图片支持、PR 评论中 @copilot 模型选择器、企业会话筛选器和用户级 CLI 使用指标。 用户现可通过粘贴、拖拽或点击图片图标在 github.com 上启动 Agent 会话。在 PR 评论中提及 @copilot 时会出现模型选择器,目前仅限 github.com。Enterprise AI Controls 新增 Status、Repository 和 User 筛选条件用于 Agent 会话管理。CLI 使用指标现包含用户级活动数据,是上周企业级遥测的延续。 [2][20][21][22]

  • Cursor 推出 Automations,用于构建常驻事件驱动 Agent。 Automations 可按计划运行或由来自 Slack、Linear、GitHub、PagerDuty 和 Webhook 的事件触发。每个自动化在云沙箱中启动,按配置的 MCP 和模型执行指令,并可通过内置记忆工具从历史运行中学习。Cursor 内部的用例包括:每次推送到 main 时进行安全审查、自动审批低风险 PR 的智能代码责任人、通过 Datadog MCP 进行 PagerDuty 触发的事件响应,以及自动测试覆盖率生成。 [4][5][6]

  • GitHub Copilot CLI v0.0.422 发布,新增 GPT-5.4 支持和大量新功能。 主要新增:从 ~/.copilot/hooks 加载个人钩子、Ctrl+R 反向增量命令历史搜索、启动提示钩子用于自动提交 Prompt、--output-format json 输出 JSONL、enabledPlugins 配置实现自动插件安装、SSH 插件 URL 支持,以及会话使用指标持久化到 events.jsonl。还包括 SDK 计划审批的 exitPlanMode.request、后台命令完成自动通知,以及配置文件从 .github/copilot/config.json 重命名为 settings.json。 [23]

  • Claude Code v2.1.69 发布大规模更新,包含 80 余项变更,涵盖功能、安全和性能。 新增 /claude-api 技能用于构建 Claude API 应用、10 种新语音 STT 语言(累计 20 种)、/reload-plugins 命令、InstructionsLoaded 钩子事件和 ${CLAUDE_SKILL_DIR} 变量。关键安全修复解决了从 gitignored 目录加载嵌套技能、信任对话框静默启用 .mcp.json 服务器,以及 acceptEdits 模式下的符号链接绕过等问题。多项内存泄漏修复使基础内存降低约 16MB 并改善长会话稳定性。VSCode 新增会话列表的 spark 图标、Markdown 计划视图和原生 MCP 服务器管理对话框。 [11]

  • OpenAI Codex 发布 v0.110.0 和 v0.111.0,引入插件系统并默认启用快速模式。 v0.110.0 新增完整插件系统,可从配置或本地市场加载技能、MCP 条目和应用连接器,同时扩展了多 Agent TUI,支持审批提示、序数昵称和角色标记的交接上下文。还引入了工作区级记忆写入(带防止陈旧数据的保护措施)和 Windows 直接安装脚本。v0.111.0 默认启用快速模式,新增 js_repl 本地文件导入,在会话启动时展示已启用插件,并在 app-server v2 中将 MCP 征询暴露为结构化请求/响应流。 [12][13]

  • Gemini CLI v0.34.0-nightly 新增实验性 LXC 容器沙箱、跟踪工具和循环检测。 主要变更包括跟踪器 CRUD 工具与可视化、改进的 @file 自动补全(优先文件名匹配)、带模型反馈的迭代循环检测、npm 包中附带 esbuild 构建包,以及模型持久化、MCP notifications/tools/list_changed 支持和非交互式会话中 OAuth 挂起等问题的修复。同时支持沙箱的多架构 Docker 构建。 [14]

  • OpenCode 连发两个版本:v1.2.17 重构工作区集成,v1.2.18 新增基于 Ghostty 分支的 Web 桌面终端。 v1.2.17 重构了工作区集成和适配器接口,默认显示滚动条,并防止关闭时产生孤立子进程。v1.2.18 在桌面应用中引入 Ghostty 分支实现 Web 终端、桌面深度链接支持创建新会话、改进了已配置模型的 Agent 选择逻辑,以及 auth login 命令新增跳过交互式问题的选项。 [15][16]

  • Kiro v0.10.78 新增实时上下文用量横幅,带模型感知的估算。 该横幅展示上下文窗口的消耗分布——如 MCP 工具或引导文件——当任何单一类别超过可用上下文的 30% 时发出警告。本版本还修复了窗口重载时会话历史丢失的问题,应用了关键 Chromium 安全补丁(CVE-2026-2441),修复了 supervised 模式静默回退到 autopilot 的竞态条件,并纠正了上下文选择快捷键(Cmd+Shift+L / Cmd+L)。 [24]

  • OpenAI Codex Windows 应用在 Product Hunt 上线。 Codex Agent 编程应用现已提供原生 Windows 版本,将平台支持从 Web 和 macOS 扩展至 Windows。 [25]