[ PROMPT_NODE_26686 ]
hmdb_data_fields
[ SKILL_DOCUMENTATION ]
# HMDB 数据字段参考
本文档提供了 HMDB 代谢物条目中可用数据字段的详细信息。
## 代谢物条目结构
每个 HMDB 代谢物条目包含 130+ 个数据字段,分为多个类别:
### 化学数据字段
**标识:**
- `accession`: 主要 HMDB ID (例如 HMDB0000001)
- `secondary_accessions`: 合并条目之前的旧 HMDB ID
- `name`: 主要代谢物名称
- `synonyms`: 别名和常用名
- `chemical_formula`: 分子式 (例如 C6H12O6)
- `average_molecular_weight`: 平均分子量 (道尔顿)
- `monoisotopic_molecular_weight`: 单同位素分子量
**结构表示:**
- `smiles`: 简化分子线性输入规范字符串
- `inchi`: 国际化学标识符字符串
- `inchikey`: 用于快速查找的哈希化 InChI
- `iupac_name`: IUPAC 系统名称
- `traditional_iupac`: 传统 IUPAC 名称
**化学性质:**
- `state`: 物理状态(固体、液体、气体)
- `charge`: 净分子电荷
- `logp`: 辛醇-水分配系数(实验值/预测值)
- `pka_strongest_acidic`: 最强酸性 pKa 值
- `pka_strongest_basic`: 最强碱性 pKa 值
- `polar_surface_area`: 拓扑极性表面积 (TPSA)
- `refractivity`: 摩尔折射率
- `polarizability`: 分子极化率
- `rotatable_bond_count`: 可旋转键数量
- `acceptor_count`: 氢键受体数量
- `donor_count`: 氢键供体数量
**化学分类:**
- `kingdom`: 化学界 (例如有机化合物)
- `super_class`: 化学超类
- `class`: 化学类
- `sub_class`: 化学子类
- `direct_parent`: 直接化学母体
- `alternative_parents`: 替代母体分类
- `substituents`: 存在的化学取代基
- `description`: 化合物的文字描述
### 生物学数据字段
**代谢物来源:**
- `origin`: 代谢物来源(内源性、外源性、药物代谢物、食物成分)
- `biofluid_locations`: 发现的生物流体(血液、尿液、唾液、脑脊液等)
- `tissue_locations`: 发现的组织(肝脏、肾脏、大脑、肌肉等)
- `cellular_locations`: 亚细胞位置(细胞质、线粒体、膜等)
**生物样本信息:**
- `biospecimen`: 生物样本类型
- `status`: 检测状态(已检测、预期、预测)
- `concentration`: 浓度范围及单位
- `concent