# Biopython:Python 中的计算分子生物学
## 概述
Biopython 是一套全面的、可免费获取的 Python 生物计算工具。它提供了用于序列操作、文件 I/O、数据库访问、结构生物信息学、系统发育学以及许多其他生物信息学任务的功能。当前版本为 **Biopython 1.85**(2025 年 1 月发布),支持 Python 3 并需要 NumPy。
## 何时使用此技能
在以下场景使用此技能:
- 处理生物序列(DNA、RNA 或蛋白质)
- 读取、写入或转换生物文件格式(FASTA, GenBank, FASTQ, PDB, mmCIF 等)
- 通过 Entrez 访问 NCBI 数据库(GenBank, PubMed, Protein, Gene 等)
- 运行 BLAST 搜索或解析 BLAST 结果
- 执行序列比对(成对或多序列比对)
- 从 PDB 文件分析蛋白质结构
- 创建、操作或可视化系统发育树
- 查找序列基序或分析基序模式
- 计算序列统计信息(GC 含量、分子量、熔解温度等)
- 执行结构生物信息学任务
- 处理群体遗传学数据
- 任何其他计算分子生物学任务
## 核心能力
Biopython 被组织成模块化的子包,每个子包针对特定的生物信息学领域:
1. **序列处理** - Bio.Seq 和 Bio.SeqIO,用于序列操作和文件 I/O
2. **比对分析** - Bio.Align 和 Bio.AlignIO,用于成对和多序列比对
3. **数据库访问** - Bio.Entrez,用于以编程方式访问 NCBI 数据库
4. **BLAST 操作** - Bio.Blast,用于运行和解析 BLAST 搜索
5. **结构生物信息学** - Bio.PDB,用于处理 3D 蛋白质结构
6. **系统发育学** - Bio.Phylo,用于系统发育树的操作和可视化
7. **高级功能** - 基序、群体遗传学、序列工具等
## 安装与设置
使用 pip 安装 Biopython(需要 Python 3 和 NumPy):
python
uv pip install biopython
对于 NCBI 数据库访问,请务必设置您的电子邮件地址(NCBI 要求):
python
from Bio import Entrez
Entrez.email = "
[email protected]"
# 可选:用于更高速率限制的 API 密钥(10 次请求/秒,而非 3 次请求/秒)
Entrez.api_key = "your_api_key_here"
## 使用此技能
此技能提供按功能区域组织的综合文档。在处理任务时,请查阅相关的参考资料。