[ PROMPT_NODE_26564 ]
chemistry_molecular_formats
[ SKILL_DOCUMENTATION ]
# 化学与分子文件格式参考
本参考指南涵盖了计算化学、化学信息学、分子建模及相关领域中常用的文件格式。
## 结构文件格式
### .pdb - 蛋白质数据库文件 (Protein Data Bank)
**描述:** 生物大分子 3D 结构的标准格式
**典型数据:** 原子坐标、残基信息、二级结构、晶体结构数据
**应用场景:** 蛋白质结构分析、分子可视化、分子对接研究
**Python 库:**
- `Biopython`: `Bio.PDB`
- `MDAnalysis`: `MDAnalysis.Universe('file.pdb')`
- `PyMOL`: `pymol.cmd.load('file.pdb')`
- `ProDy`: `prody.parsePDB('file.pdb')`
**EDA 方法:**
- 结构验证(键长、键角、空间冲突)
- 二级结构分析
- B-因子分布
- 缺失残基/原子检测
- 用于验证的拉氏图 (Ramachandran plots)
- 表面积和体积计算
### .cif - 晶体学信息文件 (Crystallographic Information File)
**描述:** 用于晶体学信息的结构化数据格式
**典型数据:** 晶胞参数、原子坐标、对称操作、实验数据
**应用场景:** 晶体结构测定、结构生物学、材料科学
**Python 库:**
- `gemmi`: `gemmi.cif.read_file('file.cif')`
- `PyCifRW`: `CifFile.ReadCif('file.cif')`
- `Biopython`: `Bio.PDB.MMCIFParser()`
**EDA 方法:**
- 数据完整性检查
- 分辨率和质量指标
- 晶胞参数分析
- 对称群验证
- 原子位移参数
- R-因子及验证指标
### .mol - MDL Molfile
**描述:** 由 MDL/Accelrys 开发的化学结构文件格式
**典型数据:** 2D/3D 坐标、原子类型、键级、电荷
**应用场景:** 化学数据库存储、化学信息学、药物设计
**Python 库:**
- `RDKit`: `Chem.MolFromMolFile('file.mol')`
- `Open Babel`: `pybel.readfile('mol', 'file.mol')`
- `ChemoPy`: 用于描述符计算
**EDA 方法:**
- 分子属性计算 (MW, logP, TPSA)
- 官能团分析
- 环系统检测
- 立体化学验证
- 2D/3D 坐标一致性
- 价态和电荷验证
### .mol2 - Tripos Mol2
**描述:** 包含原子类型的完整 3D 分子结构格式
**典型数据:** 坐标、SYBYL 原子类型、键类型、电荷、子结构
**应用场景:** 分子对接、QSAR 研究、药物发现
**Python 库:**
- `RDKit`: `Chem.MolFromMol2File('file.mol2')`
- `Ope