[ PROMPT_NODE_27288 ]

evidence_hierarchy

[ SKILL_DOCUMENTATION ]

# 证据等级与质量评估 ## 传统证据等级 (医学/临床) ### 第 1 级：系统评价和荟萃分析 **描述：** 对某一问题所有可用证据的全面综合。 **优势：** - 结合多项研究以获得更大的统计效能 - 减少单项研究异常值的影响 - 可以识别跨研究的模式 - 量化总体效应量 **劣势：** - 质量取决于纳入的研究（“垃圾进，垃圾出”） - 发表偏倚可能扭曲结果 - 异质性可能导致合并分析不恰当 - 可能掩盖研究间的重要差异 **批判性评估：** - 搜索是否全面（多个数据库、灰色文献）？ - 纳入标准是否恰当且预先设定？ - 是否评估了研究质量？ - 是否探讨了异质性？ - 是否评估了发表偏倚（漏斗图、失效安全 N）？ - 是否使用了恰当的统计方法？ ### 第 2 级：随机对照试验 (RCTs) **描述：** 对条件进行随机分配的实验性研究。 **优势：** - 建立因果关系的黄金标准 - 控制已知和未知的混杂因素 - 最小化选择偏倚 - 实现因果推断 **劣势：** - 可能不符合伦理或不可行 - 人工环境可能限制普适性 - 通常是针对特定人群的短期研究 - 昂贵且耗时 **批判性评估：** - 随机化是否充分（序列生成、分配隐藏）？ - 是否实施了盲法（参与者、提供者、评估者）？ - 样本量是否充足（效能分析）？ - 是否使用了意向性分析 (ITT)？ - 减员率是否可接受且平衡？ - 结果是否具有普适性？ ### 第 3 级：队列研究 **描述：** 随时间推移跟踪群体的观察性研究。 **类型：** - **前瞻性：** 从暴露到结果向前跟踪 - **回顾性：** 回顾现有数据 **优势：** - 可以研究多种结果 - 建立时间顺序 - 可以计算发病率和相对风险 - 对于许多问题比 RCT 更可行 **劣势：** - 易受混杂因素影响 - 可能存在选择偏倚 - 减员可能偏倚结果 - 不能最终证明因果关系 **批判性评估：** - 基线时队列是否可比？ - 暴露测量是否可靠？ - 随访是否充分且完整？ - 是否测量并控制了潜在的混杂因素？ - 结果评估是否对暴露情况设盲？

数据来源：claude-code-templates（MIT），中文翻译由 AI 生成。详见关于我们。

BAGUA AI