[ PROMPT_NODE_26958 ]
pathml
[ SKILL_DOCUMENTATION ]
# PathML
## 概述
PathML 是一个用于计算病理学工作流的综合 Python 工具包,旨在促进全切片病理图像的机器学习和图像分析。该框架提供了模块化、可组合的工具,用于加载多种切片格式、图像预处理、构建空间图、训练深度学习模型以及分析来自 CODEX 和多重免疫荧光等技术的多参数成像数据。
## 何时使用此技能
在以下场景应用此技能:
- 加载和处理各种专有格式的全切片图像 (WSI)
- 使用染色归一化预处理 H&E 染色组织图像
- 细胞核检测、分割和分类工作流
- 构建用于空间分析的细胞和组织图
- 在病理数据上训练或部署机器学习模型 (HoVer-Net, HACTNet)
- 分析用于空间蛋白质组学的多参数成像 (CODEX, Vectra, MERFISH)
- 从多重免疫荧光中量化标记物表达
- 使用 HDF5 存储管理大规模病理数据集
- 基于切片 (Tile) 的分析和拼接操作
## 核心能力
PathML 提供了六大核心能力领域,详细记录在参考文件中:
### 1. 图像加载与格式
加载来自 160 多种专有格式的全切片图像,包括 Aperio SVS、Hamamatsu NDPI、Leica SCN、Zeiss ZVI、DICOM 和 OME-TIFF。PathML 自动处理供应商特定格式,并提供用于访问图像金字塔、元数据和感兴趣区域的统一接口。
**参见:** `references/image_loading.md` 获取支持的格式、加载策略以及处理不同切片类型的信息。
### 2. 预处理流水线
通过组合用于图像操作、质量控制、染色归一化、组织检测和掩码操作的转换,构建模块化预处理流水线。PathML 的流水线架构实现了跨大规模数据集的可重复、可扩展的预处理。
**关键转换:**
- `StainNormalizationHE` - Macenko/Vahadane 染色归一化
- `TissueDetectionHE`, `NucleusDetectionHE` - 组织/细胞核分割
- `MedianBlur`, `GaussianBlur` - 降噪
- `LabelArtifactTileHE` - 伪影质量控制
**参见:** `references/preprocessing.md` 获取完整的转换目录、流水线构建和预处理工作流。
### 3. 图构建
构建代表细胞和组织层面关系的各种空间图。从分割结果中提取特征