[ PROMPT_NODE_26722 ]
ontologies
[ SKILL_DOCUMENTATION ]
# LaminDB 本体管理
本文档涵盖了通过 Bionty 插件在 LaminDB 中进行生物本体管理,包括访问、搜索以及使用标准化生物学术语进行数据标注。
## 概述
LaminDB 集成了 `bionty` 插件来管理标准化的生物本体,从而在研究项目中实现一致的元数据整理和数据标注。Bionty 提供对 20 多种经过整理的生物本体的访问,涵盖基因、蛋白质、细胞类型、组织、疾病等。
## 可用本体
LaminDB 提供对多种经过整理的本体来源的访问:
| 注册表 | 本体来源 | 描述 |
|----------|----------------|-------------|
| **Gene** | Ensembl | 各物种的基因(人类、小鼠等) |
| **Protein** | UniProt | 蛋白质序列和标注 |
| **CellType** | Cell Ontology (CL) | 标准化细胞类型分类 |
| **CellLine** | Cell Line Ontology (CLO) | 细胞系标注 |
| **Tissue** | Uberon | 解剖结构和组织 |
| **Disease** | Mondo, DOID | 疾病分类 |
| **Phenotype** | Human Phenotype Ontology (HPO) | 表型异常 |
| **Pathway** | Gene Ontology (GO) | 生物通路和过程 |
| **ExperimentalFactor** | Experimental Factor Ontology (EFO) | 实验变量 |
| **DevelopmentalStage** | Various | 各物种的发育阶段 |
| **Ethnicity** | HANCESTRO | 人类祖先本体 |
| **Drug** | DrugBank | 药物化合物 |
| **Organism** | NCBItaxon | 分类学分类 |
## 安装与导入
python
# 安装 bionty (包含在 lamindb 中)
pip install lamindb
# 导入
import lamindb as ln
import bionty as bt
## 导入公共本体
使用公共本体来源填充您的注册表:
python
# 导入细胞本体
bt.CellType.import_source()
# 导入特定物种的基因
bt.Gene.import_source(organism="human")
bt.Gene.import_source(organism="mouse")
# 导入组织
bt.Tissue.import_source()
# 导入疾病
bt.Disease.import_source(source="mondo") # Mondo 疾病本体
bt.Disease.import_source(source="doid") # 疾病本体
## 搜索与访问记录
### 关键词搜索
python
# 搜索细胞类型
bt.CellType.search("T cell").to_dataframe()
bt.CellType.search("gamma-delta").to_dataframe()
# 搜索基因
bt.Gene.search("CD8").to_dataframe()
bt.Gene.search("TP53").to_dataframe()
# 搜索疾病
bt.Disease.search("cancer").to_data