[ PROMPT_NODE_26468 ]
Deeptools 工作流
[ SKILL_DOCUMENTATION ]
# deepTools 常见工作流
本文档提供了常见 deepTools 分析的完整工作流示例。
## ChIP-seq 质量控制工作流
针对 ChIP-seq 实验的完整质量控制评估。
### 第 1 步:初始相关性评估
比较重复样本和实验样本以验证实验质量:
bash
# 生成全基因组覆盖度矩阵
multiBamSummary bins
--bamfiles Input1.bam Input2.bam ChIP1.bam ChIP2.bam
--labels Input_rep1 Input_rep2 ChIP_rep1 ChIP_rep2
-o readCounts.npz
--numberOfProcessors 8
# 创建相关性热图
plotCorrelation
-in readCounts.npz
--corMethod pearson
--whatToShow heatmap
--plotFile correlation_heatmap.png
--plotNumbers
# 生成 PCA 图
plotPCA
-in readCounts.npz
-o PCA_plot.png
-T "ChIP-seq 样本的 PCA"
**预期结果:**
- 重复样本应聚类在一起
- Input 样本应与 ChIP 样本区分开
---
### 第 2 步:覆盖度和深度评估
bash
# 检查测序深度和覆盖度
plotCoverage
--bamfiles Input1.bam ChIP1.bam ChIP2.bam
--labels Input ChIP_rep1 ChIP_rep2
--plotFile coverage.png
--ignoreDuplicates
--numberOfProcessors 8
**解释:** 评估测序深度是否足以进行后续分析。
---
### 第 3 步:片段大小验证(双端测序)
bash
# 验证预期的片段大小
bamPEFragmentSize
--bamfiles Input1.bam ChIP1.bam ChIP2.bam
--histogram fragmentSizes.png
--plotTitle "片段大小分布"
**预期结果:** 片段大小应符合文库制备方案(ChIP-seq 通常为 200-600bp)。
---
### 第 4 步:GC 偏差检测与校正
bash
# 计算 GC 偏差
computeGCBias
--bamfile ChIP1.bam
--effectiveGenomeSize 2913022398
--genome genome.2bit
--fragmentLength 200
--biasPlot GCbias.png
--frequenciesFile freq.txt
# 如果检测到偏差,进行校正
correctGCBias
--bamfile ChIP1.bam
--effectiveGenomeSize 2913022398
--genome genome.2bit
--GCbiasFrequenciesFile freq.txt
--correctedFile ChIP1_GCcorrected.bam
**注意:** 仅在观察到显著偏差时才进行校正。不要对 GC 校正后的文件使用 `--ignoreDuplicates`。
---
### 第 5 步:ChIP 信号强度评估
bash
# 评估 ChIP 富集质量
plotFingerprint
--bamfiles Input1.bam ChIP1.bam ChIP2.bam
--labels "...