[ PROMPT_NODE_26466 ]
tools_reference
[ SKILL_DOCUMENTATION ]
# deepTools 完整工具参考
本文档提供了按类别组织的 deepTools 命令行工具的综合参考。
## BAM 和 bigWig 文件处理工具
### multiBamSummary
计算多个 BAM 文件中基因组区域的读取覆盖度,输出压缩的 numpy 数组,用于后续的相关性和 PCA 分析。
**模式:**
- **bins**: 使用连续等长窗口(默认 10kb)进行全基因组分析
- **BED-file**: 将分析限制在用户指定的基因组区域
**关键参数:**
- `--bamfiles, -b`: 索引过的 BAM 文件(空格分隔,必需)
- `--outFileName, -o`: 输出覆盖度矩阵文件(必需)
- `--BED`: 区域指定文件(仅限 BED-file 模式)
- `--binSize`: 窗口大小(以碱基为单位,默认:10,000)
- `--labels`: 自定义样本标识符
- `--minMappingQuality`: 读取包含的质量阈值
- `--numberOfProcessors, -p`: 并行处理核心数
- `--extendReads`: 片段大小扩展
- `--ignoreDuplicates`: 移除 PCR 重复项
- `--outRawCounts`: 导出带有坐标列和各样本计数的制表符分隔文件
**输出:** 用于 plotCorrelation 和 plotPCA 的压缩 numpy 数组 (.npz)
**常用用法:**
bash
# 全基因组比较
multiBamSummary bins --bamfiles sample1.bam sample2.bam -o results.npz
# 峰值区域比较
multiBamSummary BED-file --BED peaks.bed --bamfiles sample1.bam sample2.bam -o results.npz
---
### multiBigwigSummary
类似于 multiBamSummary,但操作对象是 bigWig 文件而非 BAM 文件。用于比较样本间的覆盖度轨迹。
**模式:**
- **bins**: 全基因组分析
- **BED-file**: 区域特异性分析
**关键参数:** 与 multiBamSummary 类似,但接受 bigWig 文件
---
### bamCoverage
将 BAM 比对文件转换为 bigWig 或 bedGraph 格式的归一化覆盖度轨迹。计算每个分箱的读取数作为覆盖度。
**关键参数:**
- `--bam, -b`: 输入 BAM 文件(必需)
- `--outFileName, -o`: 输出文件名(必需)
- `--outFileFormat, -of`: 输出类型(bigwig 或 bedgraph)
- `--normalizeUsing`: 归一化方法
- **RPKM**: 每百万映射读取中每千碱基的读取数
- **CPM**: 每百万映射读取的计数
- **BPM**: 每百万映射读取的分箱数
- **RPGC**: 基于基因组内容的读取数(需要 --effectiveGenomeSize)
- **None**: 不进行归一化(默认)
- `--effectiveGenomeSize`: 可映射基因组大小(RPGC 必需)
- `--binSize`: 分辨率