[ PROMPT_NODE_27288 ]
evidence_hierarchy
[ SKILL_DOCUMENTATION ]
# 证据等级与质量评估
## 传统证据等级 (医学/临床)
### 第 1 级:系统评价和荟萃分析
**描述:** 对某一问题所有可用证据的全面综合。
**优势:**
- 结合多项研究以获得更大的统计效能
- 减少单项研究异常值的影响
- 可以识别跨研究的模式
- 量化总体效应量
**劣势:**
- 质量取决于纳入的研究(“垃圾进,垃圾出”)
- 发表偏倚可能扭曲结果
- 异质性可能导致合并分析不恰当
- 可能掩盖研究间的重要差异
**批判性评估:**
- 搜索是否全面(多个数据库、灰色文献)?
- 纳入标准是否恰当且预先设定?
- 是否评估了研究质量?
- 是否探讨了异质性?
- 是否评估了发表偏倚(漏斗图、失效安全 N)?
- 是否使用了恰当的统计方法?
### 第 2 级:随机对照试验 (RCTs)
**描述:** 对条件进行随机分配的实验性研究。
**优势:**
- 建立因果关系的黄金标准
- 控制已知和未知的混杂因素
- 最小化选择偏倚
- 实现因果推断
**劣势:**
- 可能不符合伦理或不可行
- 人工环境可能限制普适性
- 通常是针对特定人群的短期研究
- 昂贵且耗时
**批判性评估:**
- 随机化是否充分(序列生成、分配隐藏)?
- 是否实施了盲法(参与者、提供者、评估者)?
- 样本量是否充足(效能分析)?
- 是否使用了意向性分析 (ITT)?
- 减员率是否可接受且平衡?
- 结果是否具有普适性?
### 第 3 级:队列研究
**描述:** 随时间推移跟踪群体的观察性研究。
**类型:**
- **前瞻性:** 从暴露到结果向前跟踪
- **回顾性:** 回顾现有数据
**优势:**
- 可以研究多种结果
- 建立时间顺序
- 可以计算发病率和相对风险
- 对于许多问题比 RCT 更可行
**劣势:**
- 易受混杂因素影响
- 可能存在选择偏倚
- 减员可能偏倚结果
- 不能最终证明因果关系
**批判性评估:**
- 基线时队列是否可比?
- 暴露测量是否可靠?
- 随访是否充分且完整?
- 是否测量并控制了潜在的混杂因素?
- 结果评估是否对暴露情况设盲?