[ PROMPT_NODE_26276 ]
services_reference
[ SKILL_DOCUMENTATION ]
# BioServices: 完整服务参考
本文档提供了 BioServices 中所有主要服务的综合参考,包括关键方法、参数和使用案例。
## 蛋白质与基因资源
### UniProt
蛋白质序列和功能信息数据库。
**初始化:**
python
from bioservices import UniProt
u = UniProt(verbose=False)
**关键方法:**
- `search(query, frmt="tab", columns=None, limit=None, sort=None, compress=False, include=False, **kwargs)`
- 使用灵活的查询语法搜索 UniProt
- `frmt`: "tab", "fasta", "xml", "rdf", "gff", "txt"
- `columns`: 逗号分隔列表 (例如 "id,genes,organism,length")
- 返回: 所需格式的字符串
- `retrieve(uniprot_id, frmt="txt")`
- 检索特定的 UniProt 条目
- `frmt`: "txt", "fasta", "xml", "rdf", "gff"
- 返回: 所需格式的条目数据
- `mapping(fr="UniProtKB_AC-ID", to="KEGG", query="P43403")`
- 在数据库之间转换标识符
- `fr`/`to`: 数据库标识符 (参见 identifier_mapping.md)
- `query`: 单个 ID 或逗号分隔列表
- 返回: 将输入 ID 映射到输出 ID 的字典
- `searchUniProtId(pattern, columns="entry name,length,organism", limit=100)`
- 基于 ID 搜索的便捷方法
- 返回: 制表符分隔的值
**常用列:** id, entry name, genes, organism, protein names, length, sequence, go-id, ec, pathway, interactor
**使用案例:**
- 用于 BLAST 的蛋白质序列检索
- 功能注释查找
- 跨数据库标识符映射
- 批量蛋白质信息检索
---
### KEGG (京都基因与基因组百科全书)
代谢通路、基因和生物体数据库。
**初始化:**
python
from bioservices import KEGG
k = KEGG()
k.organism = "hsa" # 设置默认生物体
**关键方法:**
- `list(database)`
- 列出 KEGG 数据库中的条目
- `database`: "organism", "pathway", "module", "disease", "drug", "compound"
- 返回: 包含条目的多行字符串
- `find(database, query)`
- 按关键字搜索数据库
- 返回: 带有 ID 的匹配条目列表
- `get(entry_id)`
- 按 ID 检索条目
- 支持基因、通路、化合物等
- 返回: 原始条目文本
- `parse(data)`
- 将 KEGG 条目解析为字典
- 返回: 包含结构化数据的字典
- `lookfor_organism(name)`
- 按名称模式搜索生物体
- 返回: 匹配的生物体代码列表
- `lookfor_pathway(name)`
- 按名称搜索通路
- R