AI Coding News

March 24, 2026

关键信号

Claude Code 全新"自动模式"将权限决策从开发者转移至 AI 安全层，标志着智能编程工具处理自主权方式的重要转折点。 开发者不再需要在逐一审批每个操作或通过 dangerously-skip-permissions 完全放权之间做选择，自动模式使用 AI 审查器在执行前将每个操作分类为安全或高风险，自动拦截提示注入和未授权行为。该功能目前以研究预览形式发布，仅支持 Claude Sonnet 4.6 和 Opus 4.6，Anthropic 建议在沙盒环境中使用——这反映出业界的共识：完全的智能体自主权需要全新的信任架构，而不仅仅是更好的模型。 [1][2]
Anthropic 将 Claude 的计算机操控能力扩展至桌面控制——可打开应用、操作浏览器和编辑文件——掀起多厂商 AI 桌面控制竞赛。 该功能紧随 Perplexity（Personal Computer）、Manus（My Computer）和 Nvidia（NemoClaw）在数周内相继发布的类似产品。这波浪潮直接源于 2026 年初 OpenClaw 的病毒式传播，促使 OpenAI 聘请了其创建者。Anthropic 坦承其安全措施"并非完美"，默认限制对交易平台等敏感应用类别的访问，凸显了智能体能力与安全性之间尚未解决的张力。 [3][4]
GitHub Copilot 编程智能体现在可在任意 Pull Request 中通过 @copilot 直接调用，这一重大工作流变化将 AI 辅助更深入地嵌入代码审查环节。 此前 Copilot 会创建一个独立的 PR；现在它在云端环境中通过测试和代码检查验证后，直接将更改推送至现有分支。结合新发布的用于大规模管理编程智能体仓库访问权限的 REST API，GitHub 正在系统性地消除组织采用 AI 辅助开发的摩擦。 [5][6]
"编码从来不是瓶颈"这一论点获得实证支持：Faros AI 对超过一万名开发者的数据分析显示，采用 AI 后完成任务量增加 21%，但 PR 审查时间增加了 91%，瓶颈转移至规格说明和验证环节。 Agoda 工程团队提出"灰盒"模型：开发者负责规格说明和验收标准，将生成的代码视为中间产物——既非逐行审查（白盒），也非盲目发布（黑盒）。freeCodeCamp 上的一篇互补教程介绍了"spec-writer"——一个 Claude Code 技能，可生成带有明确 [ASSUMPTION] 标签的结构化规格说明，兼容 Claude Code、Cursor、GitHub Copilot 和 Gemini CLI。围绕规格驱动开发（Spec-Driven Development）的这种趋同可能重塑团队集成 AI 编程智能体的方式。 [7][8]
Gemini CLI 同日发布两个重大版本，推进子智能体架构并引入原生操作系统沙盒和并行工具执行能力。 v0.36.0-preview.0 引入了子智能体多注册表工具过滤、macOS Seatbelt 沙盒、Windows 原生沙盒、Git worktree 隔离并行会话支持，以及实验性内存管理智能体。稳定版 v0.35.0 新增了可自定义键盘快捷键、模型驱动的并行工具调度器和安全工具并发执行。这两个版本表明 Google 正在推动构建一个完全沙盒化的多智能体 CLI 环境。 [9][10]
Mozilla 的"cq"项目提出为编程智能体建立共享知识库，以解决数千个智能体独立重复解决相同问题的高昂成本。 该系统允许智能体在开始不熟悉的工作前查询共享池，并将新发现贡献回去，知识通过经过验证的使用获得信任，而非依赖权威。这直接解决了两个持续性痛点——训练截止日期导致的信息过时，以及静态 .md 指令文件的局限性——如果获得广泛采用，可能从根本上改变智能体积累和共享专业知识的方式。 [11]

AI 编程新闻

Claude 的计算机操控能力现已扩展到 Cowork 中的桌面控制，用户可从手机下发任务，AI 会通过打开应用、操作浏览器和填写电子表格来执行。 Anthropic 将其定位为带有内置安全保障的研究预览：Claude 在访问新应用前会请求许可，并屏蔽加密货币和交易平台等类别。该公司承认基于训练的安全措施并不完美，警告"Claude 可能偶尔超出这些边界"。该功能直接与 Perplexity 的 Personal Computer、Manus 的 My Computer 和 Nvidia 的 NemoClaw 竞争，后者均在数周内发布。 [3][4]
Mozilla 开发者 Peter Wilson 推出"cq"——一个面向 AI 编程智能体的知识共享平台，被称为"智能体的 Stack Overflow"。 智能体在处理不熟悉的 API、CI/CD 配置或框架前查询 cq 知识库，并将新解决方案贡献回池中。该系统旨在用一个动态知识库取代静态的 claude.md 和 agents.md 文件，条目通过经过确认的使用获得信任。安全性、数据投毒和准确性仍是决定该项目能否获得有意义采用的开放挑战。 [11]
Kubernetes 联合创始人 Brendan Burns 认为 AI 生成的代码将变得像汇编语言一样不可见——成为没人阅读的中间产物，由测试套件而非人工审查来验证。 Burns 目前领导 Azure 旗下 1400 人的容器基础设施团队，他反驳了当前对扩展代码审查的关注："你忘了如果使用编译器，100% 的代码都是机器生成的吗？我们早就不再关心那些代码了。"他建议未来的编程语言可能为 AI 而非人类的使用习惯而设计，优先考虑形式化保证而非可读性。 [12]
Agoda 工程团队发表分析报告指出，AI 编程助手并未显著加速项目级别的交付，因为编码从来不是主要瓶颈。 该分析提出"灰盒"分类：白盒式逐行审查无法扩展，黑盒式"氛围编程"对生产环境来说太脆弱，首选的中间路线将规格说明和验证作为工程师的主要交付物。Faros AI 对 1255 个团队的研究支持了这一结论——高 AI 采用率的团队合并 PR 量增加 98%，但审查时间几乎翻倍。 [7]
freeCodeCamp 教程介绍了"spec-writer"——一个实现规格驱动开发的 Claude Code 技能，在编写任何代码之前生成带有明确假设标签的结构化规格说明。 该技能生成三项输出——SPEC（做什么）、PLAN（怎么做）和 TASKS（任务分解）——并用 [ASSUMPTION: ...] 标签标记每个隐含决定，按架构影响排序。它采用 Agent Skills 标准，可在 Claude Code、Cursor、GitHub Copilot 和 Gemini CLI 之间通用，兼容 GitHub Spec Kit 和 OpenSpec 框架。 [8]
WebAssembly 成为沙盒化 AI 智能体生成代码的领先候选方案，相比依赖共享内核的容器和微虚拟机具有隔离优势。 在巴塞罗那举行的 Wasm I/O 大会上，系统工程师 Dan Phillips 展示了 Wasm 模块从零能力开始逐步添加权限的机制，使得整类漏洞"在构造层面就不可能存在"。开源项目 Boxer 通过允许开发者将现有 Dockerfile 打包为 Wasm 发行版而无需重写代码，降低了团队寻求更安全智能体执行环境的门槛。 [13]

功能更新

Claude Code 自动模式（研究预览版）让 AI 自主分类并执行安全操作，同时拦截高风险操作，取代了在持续手动审批和 dangerously-skip-permissions 之间的二选一。该功能使用 AI 安全层审查每个操作是否存在未授权行为和提示注入模式。目前仅限 Claude Sonnet 4.6 和 Opus 4.6，先向 Team 计划用户推出，随后向 Enterprise 和 API 用户开放。Anthropic 建议在预览期间使用隔离环境。 [1][2]
GitHub Copilot 编程智能体现在可在任意 Pull Request 中通过 @copilot 提及来修复失败的工作流、处理审查意见或直接在 PR 分支上进行任意更改。 该智能体在云端环境中验证更改通过测试和代码检查后再推送。此前 Copilot 会在现有 PR 之上创建新的 PR；开发者若需要原有行为仍可通过自然语言请求。可用于所有付费 Copilot 计划，Business 和 Enterprise 层级需管理员启用。 [5]
GitHub 以公开预览形式发布 Copilot 编程智能体管理 REST API，使组织管理者可通过编程方式大规模管理仓库访问权限。 这解决了企业采用的关键需求：无需逐一手动配置即可控制编程智能体可以访问哪些仓库。 [6]
Copilot SDK v0.2.1-preview.0 为 Node.js 添加斜杠命令和 UI 交互支持，为所有四种 SDK（Node.js、Python、C#、Go）添加 BYOK 模式自定义模型列表，并新增 blob 附件以支持内联图像数据。 Node.js SDK 现支持 session.ui.confirm()、session.ui.select() 和 session.ui.input() 对话框，工具可设置 skipPermission: true 以跳过逐次使用的权限提示。重要修复包括 VS Code 扩展的 CJS 兼容性、C# AOT 序列化崩溃修复，以及 Go 枚举命名约定变更为 TypeNameValue（破坏性变更）。 [14]
Gemini CLI v0.36.0-preview.0 引入多注册表子智能体架构及工具过滤、macOS Seatbelt 和 Windows 原生沙盒、Git worktree 隔离并行会话支持，以及实验性内存管理智能体。其他功能包括任务跟踪协议集成至核心系统提示、A2A 智能体确认命令、非交互模式下的计划模式支持，以及管理员强制安装 MCP 服务器。该版本合并了超过 50 个 PR，涵盖核心子智能体执行、安全和 UI 改进。 [9]
Gemini CLI v0.35.0 稳定版提供可自定义键盘快捷键、扩展 vim 模式（yank/paste、f/F/t/T 动作），以及允许安全工具并发执行的模型驱动并行工具调度器。 其他新增功能包括 --admin-policy 补充策略标志、自动化期间的浏览器输入阻止叠加层、通过环境变量自定义基础 URL 支持，以及 SandboxManager 接口和配置模式。该版本还修复了子智能体上下文传播、会话恢复和 API 错误重试等关键问题。 [10]
Kiro 将 Claude Opus 4.6 和 Sonnet 4.6 升级至 100 万上下文窗口（从 20 万提升），两个模型在 Kiro IDE 和 CLI 中正式面向 Pro、Pro+ 和 Power 层级订阅用户全面可用。 另外，MiniMax 2.5 现已在 eu-central-1（法兰克福）可用，将区域覆盖范围从 us-east-1 扩展，所有订阅层级均可使用，信用倍率为 0.25x，上下文窗口为 20 万。 [15]
OpenCode v1.3.1 新增 Poe 作为内置认证提供者、Amazon Bedrock 令牌缓存，以及 Kotlin、HCL、Lua 和 TOML 语法高亮支持。 该版本包含 14 个错误修复，涵盖会话时间线滚动、GitLab Duo Workflow 身份标识、主题模式切换和 sidecar 进程清理。命令面板快捷键更改为 Cmd+K（Cmd+P 作为备选仍然有效）。随后发布的 OpenCode v1.3.2 新增 TUI 和服务器进程调试的堆快照功能。 [16][17]
OpenAI Codex 在一天内发布四个 Rust CLI alpha 版本（0.117.0-alpha.11 至 alpha.14），延续对重写版本的快速迭代。 各版本均为增量构建，未包含详细变更日志，表明基于 Rust 的 CLI 替代版本正处于活跃开发阶段。 [18]