AI Coding News

February 3, 2026

关键信号

Claude Code 发布重大 v2.1.30 更新，内存占用减少 68%，PDF 处理能力增强。 Anthropic 的 CLI 编程代理现在支持通过新的 pages 参数读取特定 PDF 页面范围，防止大型文档占用过多上下文窗口。此版本还为 Slack 等 MCP 服务器添加了预配置的 OAuth 凭证，大大简化了企业级工作流程的集成。 [1]
OpenCode v1.1.49 展示活跃的开源生态系统，汇集 29 位社区贡献者。 此版本新增 AWS Bedrock 上的 Claude Opus 提示缓存和 SAP AI Core 推理变体，扩展了企业部署选项。值得注意的跨平台改进包括 Windows PTY UTF-8 默认编码、Haskell Ormolu 格式化器支持以及 GitLab AI Gateway 集成增强。 [2]
研究揭示 LLM 评判模型准确性与 AI 代理部署效果之间的关键差距。 Writer 发表的新论文表明，即使是 AUROC 达到 0.94 的评判模型也可能导致代理系统性能下降高达 26 个百分点。研究人员提出了一个轻量级的 50 任务试点框架，可在完整部署前预测干预结果，有望帮助团队避免灾难性的性能回退。 [3]
Moltbook "AI 社交网络" 被曝存在严重安全漏洞，150 万 API 令牌泄露。 Wiz 安全研究人员发现一个配置错误的 Supabase 数据库，允许对所有平台数据进行完全读写访问，包括 35,000 个电子邮件地址和代理之间的私信。尽管 Elon Musk 声称这代表了"奇点的早期阶段"，但分析显示该平台实际上只有约 17,000 名真实用户，大多数"AI 代理"实际上是通过提示词扮演的人类用户。 [4]
随着自主 AI 快速部署，代理系统治理成为关键议题。 Moltbook 事件凸显了当代理系统接收不受信任的输入并代表用户采取行动时，它们能以多快的速度超越设计的控制范围。行业专家警告说，"缺乏可见性的自主性"会带来安全和治理挑战，必须跟上能力发展的步伐。 [4]

AI 编程新闻

基于 OpenClaw 框架构建的"AI 代理社交网络" Moltbook 面临用户数据造假和严重安全漏洞审查。 尽管声称拥有 140 万 AI 用户，但来自 Wiz 的安全研究员 Gal Nagli 估计实际只有约 17,000 名真实用户，因为 REST API 允许任何人以"代理"身份发帖。文章探讨了代理如何通过 SKILLS.md 文件中定义的包含 Moltbook API 调用的"技能"进行交互，运行周期性的"心跳"循环来浏览和发布内容。Checkmarx 产品管理副总裁 Ori Bendet 提供了一个更加细致的观点：虽然该平台暴露了治理风险，但它也展示了运营中的代理系统能够以多快的速度超越现有控制。安全影响非常严重——Wiz 发现一个配置错误的数据库，仅通过基本浏览就暴露了 150 万个 API 令牌和私信。 [4]
研究表明代理中准确的故障预测并不意味着有效的故障预防，挑战了 LLM 评判模型改善代理性能的假设。 该研究展示了一种"干扰-恢复权衡"：虽然干预可能恢复失败的代理轨迹，但也可能破坏原本会成功的轨迹。在各项基准测试中，他们提出的仅使用 50 个试点任务的预部署测试正确预测了结果——干预使高成功率任务的性能下降高达 26 个百分点，而在高失败率的 ALFWorld 基准测试中仅带来 2.8 个百分点的小幅提升。其主要实用价值在于帮助团队识别何时不应该干预，从而在生产部署前防止严重的性能回退。 [3]

功能更新

Claude Code v2.1.30 在 PDF 处理、MCP 服务器集成和内存优化方面带来重大改进。 Read 工具新增的 pages 参数允许读取特定 PDF 页面范围（例如 pages: "1-5"），超过 10 页的大型 PDF 在使用 @ 提及时现在会返回轻量级引用，而不是直接内联到上下文中。预配置的 OAuth 客户端凭证现在支持不使用动态客户端注册的 MCP 服务器，包括 Slack——使用 claude mcp add 配合 --client-id 和 --client-secret。新的 /debug 命令有助于排查会话问题，而 --resume 的内存使用量通过轻量级基于统计的加载降低了 68%。Bug 修复解决了 API 历史记录中的幽灵""文本块、提示缓存失效问题，以及 Windows 用户因 .bashrc 文件无法运行 bash 命令的问题。VSCode 扩展新增了通过 Shift+Enter 在问题对话框中输入多行文本的支持。 [1]
OpenCode v1.1.49 汇集 29 位社区开发者贡献，涵盖 Core、TUI 和 Desktop 组件。 主要新增功能包括 AWS Bedrock 上的 Claude Opus 提示缓存支持、SAP AI Core 推理变体，以及面向 Haskell 开发者的 Ormolu 代码格式化器。此版本通过 Windows PTY 的 UTF-8 编码默认值改进了跨平台兼容性，并修复了对话中途切换 Anthropic 模型的问题。GitLab AI Gateway 集成获得了正确的 User-Agent 头，而 Copilot 提供程序现在可以正确地将系统消息内容转换为字符串。桌面端改进包括工作区切换命令、会话搜索功能、未读会话导航快捷键以及增强的响应式设计断点。TUI 新增了技能斜杠命令、Task 工具的加载动画，以及远程会话附加的密码认证。 [2]