[ PROMPT_NODE_22494 ]
lambda-labs-gpu-cloud
[ SKILL_DOCUMENTATION ]
# Lambda Labs GPU 云
在 Lambda Labs GPU 云上使用按需实例和一键集群运行机器学习工作负载的综合指南。
## 何时使用 Lambda Labs
**在以下情况使用 Lambda Labs:**
- 需要具有完整 SSH 访问权限的专用 GPU 实例
- 运行长时间的训练任务(数小时到数天)
- 希望获得简单的定价且无流量出口费用
- 需要跨会话的持久化存储
- 需要高性能多节点集群(16-512 个 GPU)
- 需要预装好的机器学习栈(Lambda Stack,包含 PyTorch, CUDA, NCCL)
**主要特性:**
- **GPU 多样性**:B200, H100, GH200, A100, A10, A6000, V100
- **Lambda Stack**:预装 PyTorch, TensorFlow, CUDA, cuDNN, NCCL
- **持久化文件系统**:在实例重启后保留数据
- **一键集群**:带有 InfiniBand 的 16-512 GPU Slurm 集群
- **简单定价**:按分钟计费,无出口流量费
- **全球区域**:全球 12 个以上区域
**可替代方案:**
- **Modal**:用于无服务器、自动扩缩容的工作负载
- **SkyPilot**:用于多云编排和成本优化
- **RunPod**:用于更便宜的竞价实例和无服务器端点
- **Vast.ai**:用于价格最低的 GPU 市场
## 快速入门
### 账户设置
1. 在 https://lambda.ai 创建账户
2. 添加支付方式
3. 从仪表板生成 API 密钥
4. 添加 SSH 密钥(启动实例前必须)
### 通过控制台启动
1. 访问 https://cloud.lambda.ai/instances
2. 点击 "Launch instance"
3. 选择 GPU 类型和区域
4. 选择 SSH 密钥
5. 可选:挂载文件系统
6. 启动并等待 3-15 分钟
### 通过 SSH 连接
bash
# 从控制台获取实例 IP
ssh ubuntu@
# 或使用特定密钥
ssh -i ~/.ssh/lambda_key ubuntu@
## GPU 实例
### 可用 GPU
| GPU | 显存 | 价格/GPU/小时 | 最佳用途 |
|-----|------|--------------|----------|
| B200 SXM6 | 180 GB | $4.99 | 超大规模模型,最快训练 |
| H100 SXM | 80 GB | $2.99-3.29 | 大模型训练 |
| H100 PCIe | 80 GB | $2.49 | 高性价比 H100 |
| GH200 | 96 GB | $1.49 | 单 GPU 大模型 |
| A100 80GB | 80 GB | $1.79 | 生产环境训练 |
| A100 40GB | 40 GB | $1.29 | 标准训练 |
| A10 | 24 GB | $0.75 | 推理,微调 |
| A6000 | 48 GB | $0.80 | 显存/价格比优秀 |
| V100 | 16 GB | $0.55 | 预算训练 |
### 实例配置
8x GPU: 最适合分布式训练 (DDP, FSDP)
4x GPU: 大模型,多 GPU 训练
2x GPU: 中等工作负载
1x GPU: 微调,推理,开发