[ PROMPT_NODE_26290 ]
chembl-database
[ SKILL_DOCUMENTATION ]
# ChEMBL 数据库
## 概述
ChEMBL 是由欧洲生物信息学研究所 (EBI) 维护的生物活性分子人工精选数据库,包含超过 200 万种化合物、1900 万条生物活性测量数据、13,000 多个药物靶点,以及已获批药物和临床候选药物的数据。使用 ChEMBL Python 客户端以程序化方式访问和查询这些数据,用于药物发现和药物化学研究。
## 何时使用此技能
当需要执行以下操作时,应使用此技能:
- **化合物搜索**:按名称、结构或属性查找分子
- **靶点信息**:检索有关蛋白质、酶或生物靶点的数据
- **生物活性数据**:查询 IC50、Ki、EC50 或其他活性测量值
- **药物信息**:查找已获批药物、作用机制或适应症
- **结构搜索**:执行相似性或子结构搜索
- **化学信息学**:分析分子属性和类药性
- **靶点-配体关系**:探索化合物-靶点相互作用
- **药物发现**:识别抑制剂、激动剂或生物活性分子
## 安装与设置
### Python 客户端
程序化访问需要 ChEMBL Python 客户端:
bash
uv pip install chembl_webresource_client
### 基本使用模式
python
from chembl_webresource_client.new_client import new_client
# 访问不同的端点
molecule = new_client.molecule
target = new_client.target
activity = new_client.activity
drug = new_client.drug
## 核心能力
### 1. 分子查询
**按 ChEMBL ID 检索:**
python
molecule = new_client.molecule
aspirin = molecule.get('CHEMBL25')
**按名称搜索:**
python
results = molecule.filter(pref_name__icontains='aspirin')
**按属性过滤:**
python
# 查找具有良好 LogP 的小分子 (MW <= 500)
results = molecule.filter(
molecule_properties__mw_freebase__lte=500,
molecule_properties__alogp__lte=5
)
### 2. 靶点查询
**检索靶点信息:**
python
target = new_client.target
egfr = target.get('CHEMBL203')
**搜索特定靶点类型:**
python
# 查找所有激酶靶点
kinases = target.filter(
target_type='SINGLE PROTEIN',
pref_name__icontains='kinase'
)
### 3. 生物活性数据
**查询靶点的活性:**
python
activity = new_client.activity
# 查找强效 EGFR 抑制剂
results = activity.filter(
target_chembl_id='CHEMBL203',
standard_type='IC50',