[ PROMPT_NODE_26648 ]
database_info
[ SKILL_DOCUMENTATION ]
# gget 数据库信息
关于 gget 模块所查询数据库的概述,包括更新频率和重要注意事项。
## 重要提示
gget 查询的数据库会持续更新,这有时会改变其结构。gget 模块会每两周进行一次自动测试,并在必要时更新以匹配新的数据库结构。请务必保持 gget 更新:
bash
pip install --upgrade gget
## 数据库目录
### 基因组参考数据库
#### Ensembl
- **使用模块:** gget ref, gget search, gget info, gget seq
- **描述:** 包含脊椎动物和无脊椎动物物种注释的综合基因组数据库
- **更新频率:** 定期发布(编号);新版本大约每 3 个月发布一次
- **访问方式:** FTP 下载,REST API
- **网站:** https://www.ensembl.org/
- **备注:**
- 支持脊椎动物和无脊椎动物基因组
- 可指定发布版本号以确保可重复性
- 提供常见物种的快捷方式('human', 'mouse')
#### UCSC Genome Browser
- **使用模块:** gget blat
- **描述:** 带有 BLAT 比对工具的基因组浏览器数据库
- **更新频率:** 随新组装定期更新
- **访问方式:** Web 服务 API
- **网站:** https://genome.ucsc.edu/
- **备注:**
- 提供多种基因组组装版本(hg38, mm39 等)
- BLAT 针对脊椎动物基因组进行了优化
### 蛋白质与结构数据库
#### UniProt
- **使用模块:** gget info, gget seq(氨基酸序列), gget elm
- **描述:** 通用蛋白质资源,提供全面的蛋白质序列和功能信息
- **更新频率:** 定期发布(Swiss-Prot 每周,TrEMBL 每月)
- **访问方式:** REST API
- **网站:** https://www.uniprot.org/
- **备注:**
- Swiss-Prot:人工注释和审核
- TrEMBL:自动注释
#### NCBI (国家生物技术信息中心)
- **使用模块:** gget info, gget bgee(针对非 Ensembl 物种)
- **描述:** 具有广泛交叉引用的基因和蛋白质数据库
- **更新频率:** 持续更新
- **访问方式:** E-utilities API
- **网站:** https://www.ncbi.nlm.nih.gov/
- **数据库:** Gene, Protein, RefSeq
#### RCSB PDB (蛋白质数据库)
- **使用模块:** gget pdb
- **描述:** 蛋白质和核酸 3D 结构数据存储库
- **更新频率:** 每周更新
- **访问方式:** REST API
- **网站:** https://www.rcsb.org/
- **备注:**
- 实验测定