[ PROMPT_NODE_26726 ]
latchbio-integration
[ SKILL_DOCUMENTATION ]
# LatchBio 集成
## 概述
Latch 是一个用于构建和部署生物信息学工作流作为无服务器流水线的 Python 框架。它基于 Flyte 构建,支持使用 @workflow/@task 装饰器创建工作流,通过 LatchFile/LatchDir 管理云端数据,配置资源,并集成 Nextflow/Snakemake 流水线。
## 核心能力
Latch 平台提供四个主要功能领域:
### 1. 工作流创建与部署
- 使用 Python 装饰器定义无服务器工作流
- 支持原生 Python、Nextflow 和 Snakemake 流水线
- 自动 Docker 容器化
- 自动生成无代码用户界面
- 版本控制与可重复性
### 2. 数据管理
- 云存储抽象 (LatchFile, LatchDir)
- 使用注册表 (Registry) 进行结构化数据组织 (项目 → 表 → 记录)
- 具有链接和枚举的类型安全数据操作
- 本地与云端之间的自动文件传输
- 用于文件选择的 Glob 模式匹配
### 3. 资源配置
- 预配置的任务装饰器 (@small_task, @large_task, @small_gpu_task, @large_gpu_task)
- 自定义资源规格 (CPU, 内存, GPU, 存储)
- GPU 支持 (K80, V100, A100)
- 超时与存储配置
- 成本优化策略
### 4. 验证工作流
- 生产就绪的预构建流水线
- 批量 RNA-seq、DESeq2、通路分析
- 用于蛋白质结构预测的 AlphaFold 和 ColabFold
- 单细胞工具 (ArchR, scVelo, emptyDropsR)
- CRISPR 分析、系统发育学等
## 快速入门
### 安装与设置
bash
# 安装 Latch SDK
python3 -m uv pip install latch
# 登录 Latch
latch login
# 初始化新工作流
latch init my-workflow
# 将工作流注册到平台
latch register my-workflow
**先决条件:**
- 安装并运行 Docker
- Latch 账户凭据
- Python 3.8+
### 基础工作流示例
python
from latch import workflow, small_task
from latch.types import LatchFile
@small_task
def process_file(input_file: LatchFile) -> LatchFile:
"""处理单个文件"""
# 处理逻辑
return output_file
@workflow
def my_workflow(input_file: LatchFile) -> LatchFile:
"""
我的生物信息学工作流
参数:
input_file: 输入数据文件
"""
return process_file(input_file=input_file)
## 何时使用此技能
在遇到以下场景时应使用此技能:
**工作流开发:**
- "为 RNA-seq 分析创建一个 Latch 工作流"