逍遥云初

📌 核心问题

AI 写代码已经不是新鲜事，但当代码不再稀缺，什么变得稀缺？这是 2026 年 AI Coding 领域最本质的问题。腾讯研究院最新发布的《丰饶之后 AI Coding 观察报告 2.0》给出了一个令人深思的判断：模型能力趋同到六大商业模型在 SWE-bench 上挤在 1 个百分点内，「选哪个模型」已不再是关键，关键是你会不会驾驭它。

另一个硬数据揭示了「原型墙」困境：Veracode 发现 45% 的 AI 代码任务含已知漏洞，GitClear 分析 2.11 亿行代码发现技术债务增加 30-41%。AI 帮你快速做出 MVP，但剩下 30% 的完善成本可能超过从头手写。代码生成不再是瓶颈，新的瓶颈在两端：向前的规格定义，向后的验证维护。

这意味着 2026 年的 AI Coding 竞争焦点已经从「模型能力」转移到了「驾驭工程」——用工作流、约束、反馈循环让 Agent 可靠工作。这正是 Harness Engineering 的核心理念。

📊 关键数据

Opus 4.5（2025年11月）：首次突破 SWE-bench Verified 80% 门槛，token 消耗比上一代降 65%
Anthropic 9 天连发（2026年4月）：Mythos Preview（内部，93.9%）+ Opus 4.7（公开，87.6%），前沿能力与公开模型差距拉大
六大商业模型在 SWE-bench 上差距缩小到 1 个百分点以内，模型能力趋同
45% 的 AI 代码任务含已知漏洞（Veracode），技术债务增加 30-41%（GitClear，2.11 亿行代码样本）
YC 批次中 solo founder 比例从 23.7% 升至 36.3%，一人公司成为趋势
Skills 生态中 36% 含安全缺陷，安全基础设施需求迫在眉睫

🏗️ 技术架构与设计

CLI 赢了 Agent 内循环：Claude Code 发布 8 个月即成为最受喜爱的工具，命令行界面成为 Agent 编程的主流交互方式
MCP 退守企业外循环：MCP 协议从通用工具调用退向企业级集成场景，Skills 成为非开发者写 Agent 能力的首选接口
Skills 成为新接口：非技术人员 10 分钟就能用 Markdown 写出第一个 Skill，「开发者」的定义正在扩大
验证基础设施成为核心投资方向：AI 代码审查、自动化测试、安全扫描，补齐「原型墙」后面的 30%
驾驭工程（Harness Engineering）：工作流编排 + 约束注入 + 反馈循环，让 Agent 从「能用」走向「可靠」

🔑 关键洞察

🔑 模型趋同时代，工程能力 > 模型能力

🔑

当六大模型在 SWE-bench 上只差 1 个百分点，选模型已不是胜负手。真正的差异化在于：你能不能用工作流、约束、反馈循环让 Agent 可靠地完成端到端交付。这就是 Harness Engineering 的核心——不是训练更好的模型，而是更好地使用模型。

🔑 「原型墙」是 AI Coding 的最大陷阱

🔑

AI 让 MVP 原型变得几乎免费，但 45% 的代码含已知漏洞、技术债务增长 30-41%。快速原型的诱惑会让团队低估后续 30% 完善工作的成本。投资验证基础设施（AI 代码审查、自动化测试、安全扫描）不是可选项，是生存条件。

🔑 Skills 重新定义了「开发者」

🔑

当一个非技术人员 10 分钟就能用 Markdown 写出第一个 Skill，编程的门槛被彻底打破。YC solo founder 比例从 23.7% 升到 36.3%，一人公司不再是边缘现象。但 Skills 生态 36% 的安全缺陷率意味着：AIBOM、OAuth 审计、幻觉包检测将成为新的基础设施。

🔑 前沿能力与公开模型的差距在拉大

🔑

Anthropic Mythos Preview 内部达到 93.9%，但公开的 Opus 4.7 只有 87.6%。前沿实验室有意控制公开模型的能力上限。对企业用户来说，别指望用公开模型打平一切——搭建驾驭工程、善用工作流和反馈循环，才是现实路径。

🤔 引发思考

这份报告最深刻的洞察在于：AI Coding 的竞争已经从「模型层」转移到了「工程层」。当代码生成变得廉价，真正稀缺的能力是规格定义（向前）和验证维护（向后）。这与 Harness Engineering 的理念高度吻合——环境设计、渐进式披露、反馈循环、黄金原则编码，这些工程实践的价值正在被指数级放大。

另一个值得关注的趋势是 Skills 生态的崛起。它不仅是技术接口的变革，更是「开发者」定义的重塑。当非技术人员也能 10 分钟写出 Agent 能力，软件工程的民主化进入新阶段。但 36% 的安全缺陷率也敲响了警钟——我们需要像对待 npm 供应链安全一样认真对待 Skills 生态的安全治理。

📎 相关阅读

腾讯研究院：《2026 丰饶之后 AI Coding 观察报告 2.0》
Anthropic：Claude Code 发布 8 个月使用数据
Veracode：AI 代码安全漏洞分析报告
GitClear：2.11 亿行代码技术债务分析

✦

逍遥云初 | 2026.05.28

2026 丰饶之后：AI Coding 从模型竞争走向驾驭工程