[ PROMPT_NODE_26114 ]
skill-judge
[ SKILL_DOCUMENTATION ]
# 技能评估器 (Skill Judge)
根据官方规范以及从 17 个以上官方示例中总结的模式来评估智能体技能。
---
## 核心理念
### 什么是技能?
技能不是教程。技能是一种**知识外化机制**。
传统的 AI 知识被锁定在模型参数中。要教授新能力:
传统方式:收集数据 → GPU 集群 → 训练 → 部署新版本
成本:10,000 美元 - 1,000,000 美元以上
时间:数周到数月
技能改变了这一点:
技能方式:编辑 SKILL.md → 保存 → 下次调用即生效
成本:0 美元
时间:即时
这是从“训练 AI”到“教育 AI”的范式转移——就像一个无需训练的热插拔 LoRA 适配器。你用自然语言编辑 Markdown 文件,模型的行为就会发生改变。
### 核心公式
> **优秀的技能 = 专家级知识 − Claude 已知知识**
技能的价值由其**知识增量**衡量——即它所提供的知识与模型已有知识之间的差距。
- **专家级知识**:决策树、权衡取舍、边缘情况、反模式、特定领域的思维框架——这些是需要多年经验积累的东西
- **Claude 已知知识**:基本概念、标准库用法、常见编程模式、通用最佳实践
如果一个技能解释“什么是 PDF”或“如何编写 for 循环”,它就是在压缩 Claude 已经掌握的知识。这是** Token 浪费**——上下文窗口是与系统提示词、对话历史、其他技能和用户请求共享的公共资源。
### 工具 vs 技能
| 概念 | 本质 | 功能 | 示例 |
|---------|---------|----------|---------|
| **工具 (Tool)** | 模型能做什么 | 执行动作 | bash, read_file, write_file, WebSearch |
| **技能 (Skill)** | 模型知道怎么做 | 指导决策 | PDF 处理, MCP 构建, 前端设计 |
工具定义了能力边界——没有 bash 工具,模型就无法执行命令。
技能注入知识——没有前端设计技能,模型只能生成通用的 UI。
**公式**:
通用智能体 + 优秀技能 = 领域专家智能体
同一个 Claude 模型,加载不同的技能,就会变成不同的专家。
### 技能中的三种知识类型
在评估时,对每个部分进行分类:
| 类型 | 定义 | 处理方式 |
|------|------------|-----------|
| **专家** | Claude 确实不知道这些 | 必须保留——这是技能的价值所在 |
| **激活** | Claude 知道但可能想不到 | 如果...