[ PROMPT_NODE_26396 ]
clinvar-database
[ SKILL_DOCUMENTATION ]
# ClinVar 数据库
## 概述
ClinVar 是 NCBI 免费提供的档案库,记录了人类基因变异与表型之间的关系及支持证据。该数据库汇总了有关基因组变异及其与人类健康关系的信息,提供了临床遗传学和研究中使用的标准化变异分类。
## 何时使用此技能
当需要执行以下操作时,请使用此技能:
- 按基因、疾病或临床意义搜索变异
- 解释临床意义分类(致病性、良性、临床意义未明 VUS)
- 通过 E-utilities API 以编程方式访问 ClinVar 数据
- 从 FTP 下载并处理批量数据
- 了解审查状态和星级评分
- 解决冲突的变异解释
- 使用临床意义注释变异调用集 (Variant Call Sets)
## 核心能力
### 1. 搜索和查询 ClinVar
#### Web 界面查询
使用 Web 界面搜索 ClinVar:https://www.ncbi.nlm.nih.gov/clinvar/
**常见搜索模式:**
- 按基因: `BRCA1[gene]`
- 按临床意义: `pathogenic[CLNSIG]`
- 按疾病: `breast cancer[disorder]`
- 按变异: `NM_000059.3:c.1310_1313del[variant name]`
- 按染色体: `13[chr]`
- 组合查询: `BRCA1[gene] AND pathogenic[CLNSIG]`
#### 通过 E-utilities 进行编程访问
使用 NCBI 的 E-utilities API 以编程方式访问 ClinVar。请参阅 `references/api_reference.md` 获取完整的 API 文档,包括:
- **esearch** - 搜索符合条件的变异
- **esummary** - 检索变异摘要
- **efetch** - 下载完整的 XML 记录
- **elink** - 在其他 NCBI 数据库中查找相关记录
**使用 curl 的快速示例:**
bash
# 搜索致病性 BRCA1 变异
curl "https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?db=clinvar&term=BRCA1[gene]+AND+pathogenic[CLNSIG]&retmode=json"
**最佳实践:**
- 在自动化之前先在 Web 界面上测试查询
- 使用 API 密钥将速率限制从每秒 3 次提高到 10 次
- 针对速率限制错误实现指数退避策略
- 使用 Biopython 时设置 `Entrez.email`
### 2. 解释临床意义
#### 理解分类
ClinVar 使用标准化的术语进行变异分类。有关详细的解释指南,请参阅 `references/clinical_significance.md`。
**关键种系分类术语 (ACMG/AMP):**
- **致病性 (Pathogenic, P)** - 变异导致疾病(约 99% 概率)
- **可能致病性 (Likely Pathogenic, LP)** - 变异可能导致疾病