[ PROMPT_NODE_26534 ]
Ena Database API 参考
[ SKILL_DOCUMENTATION ]
# ENA API 参考
欧洲核苷酸档案 (ENA) REST API 的综合参考文档。
## ENA 门户 API
**基础 URL:** `https://www.ebi.ac.uk/ena/portal/api`
**官方文档:** https://www.ebi.ac.uk/ena/portal/api/doc
### 搜索端点
**端点:** `/search`
**方法:** GET
**描述:** 对 ENA 数据类型执行高级搜索,支持灵活的过滤和格式化选项。
**参数:**
| 参数 | 必填 | 描述 | 示例 |
|-----------|----------|-------------|---------|
| `result` | 是 | 要搜索的数据类型 | `sample`, `study`, `read_run`, `assembly`, `sequence`, `analysis`, `taxon` |
| `query` | 是 | 使用 ENA 查询语法的搜索查询 | `tax_eq(9606)`, `study_accession="PRJNA123456"` |
| `format` | 否 | 输出格式 (默认: tsv) | `json`, `tsv`, `xml` |
| `fields` | 否 | 以逗号分隔的返回字段列表 | `accession,sample_title,scientific_name` |
| `limit` | 否 | 结果的最大数量 (默认: 100000) | `10`, `1000` |
| `offset` | 否 | 用于分页的结果偏移量 | `0`, `100` |
| `sortFields` | 否 | 排序字段 (以逗号分隔) | `accession`, `collection_date` |
| `sortOrder` | 否 | 排序方向 | `asc`, `desc` |
| `dataPortal` | 否 | 限制到特定的数据门户 | `ena`, `pathogen`, `metagenome` |
| `download` | 否 | 触发文件下载 | `true`, `false` |
| `includeAccessions` | 否 | 以逗号分隔的包含访问号 | `SAMN01,SAMN02` |
| `excludeAccessions` | 否 | 以逗号分隔的排除访问号 | `SAMN03,SAMN04` |
**查询语法:**
ENA 使用带有运算符的专用查询语言:
- **相等:** `field_name="value"` 或 `field_name=value`
- **通配符:** `field_name="*partial*"` (使用 * 作为通配符)
- **范围:** `field_name>=value AND field_name=2020-01-01 AND collection_date<=2023-12-31`
- **In 运算符:** `study_accession IN (PRJNA1,PRJNA2,PRJNA3)`
**常见结果类型:**
- `study` - 研究项目/课题
- `sample` - 生物样本
- `read_run` - 原始测序运行
- `read_experiment` - 测序实验元数据
- `analysis` - 分析结果
- `assembly` - 基因组/转录组组装
- `sequence` - 组装序列
- `taxon` - 分类记录
- `coding` - 蛋白质编码序列
- `noncoding` - 非编码序列