[ PROMPT_NODE_25480 ]
Skill Creator 模式定义
[ SKILL_DOCUMENTATION ]
# JSON 模式
本文档定义了 skill-creator 使用的 JSON 模式。
---
## evals.json
定义技能的评估。位于技能目录下的 `evals/evals.json`。
{
"skill_name": "example-skill",
"evals": [
{
"id": 1,
"prompt": "用户的示例提示词",
"expected_output": "预期结果描述",
"files": ["evals/files/sample1.pdf"],
"expectations": [
"输出包含 X",
"技能使用了脚本 Y"
]
}
]
}
**字段:**
- `skill_name`: 与技能元数据匹配的名称
- `evals[].id`: 唯一整数标识符
- `evals[].prompt`: 要执行的任务
- `evals[].expected_output`: 人类可读的成功描述
- `evals[].files`: 可选的输入文件路径列表(相对于技能根目录)
- `evals[].expectations`: 可验证的陈述列表
---
## history.json
跟踪改进模式下的版本演进。位于工作区根目录。
{
"started_at": "2026-01-15T10:30:00Z",
"skill_name": "pdf",
"current_best": "v2",
"iterations": [
{
"version": "v0",
"parent": null,
"expectation_pass_rate": 0.65,
"grading_result": "baseline",
"is_current_best": false
},
{
"version": "v1",
"parent": "v0",
"expectation_pass_rate": 0.75,
"grading_result": "won",
"is_current_best": false
},
{
"version": "v2",
"parent": "v1",
"expectation_pass_rate": 0.85,
"grading_result": "won",
"is_current_best": true
}
]
}
**字段:**
- `started_at`: 开始改进的 ISO 时间戳
- `skill_name`: 正在改进的技能名称
- `current_best`: 表现最好的版本标识符
- `iterations[].version`: 版本标识符 (v0, v1, ...)
- `iterations[].parent`: 派生自的父版本
- `iterations[].expectation_pass_rate`: 来自评分的通过率
- `iterations[].grading_result`: "baseline" (基准), "won" (胜出), "lost" (失败), 或 "tie" (平局)
- `iterations[].is_current_best`: 是否为当前最佳版本
---
## grading.json
来自评分智能体的输出。位于 `/grading.json`。
{
"expectations": [
{
"text": "输出包含名称 'John Smith'",
"passed": true,
"evidence": "在执行记录第 3 步中找到:'提取的名称:John Smith, Sarah Johnson'"
},
{
"text": "电子表格在单元格 B10 中有 SUM 公式",
"passed": false,
"evidence": "无 sp