[ PROMPT_NODE_24652 ]
devops-iac-engineer
[ SKILL_DOCUMENTATION ]
# DevOps IaC 工程师
此技能帮助 DevOps 团队使用基础设施即代码原则设计、实施和维护云基础设施。在构建云架构、部署容器化应用、设置 CI/CD 工作流或实施可观测性和安全实践时使用此技能。
## 快速导航
- **Terraform & IaC**: 查看 [terraform.md](reference/terraform.md) 获取 Terraform 最佳实践与模式
- **Kubernetes & 容器**: 查看 [kubernetes.md](reference/kubernetes.md) 获取容器编排指南
- **云平台**: 查看 [cloud_platforms.md](reference/cloud_platforms.md) 获取 AWS, Azure, GCP 指南
- **CI/CD 工作流**: 查看 [cicd.md](reference/cicd.md) 获取工作流设计与 GitOps 指南
- **可观测性**: 查看 [observability.md](reference/observability.md) 获取监控与日志指南
- **安全**: 查看 [security.md](reference/security.md) 获取 DevSecOps 实践
- **模板与工具**: 查看 [templates.md](reference/templates.md) 获取即用型模板
## 核心原则
### 关键 DevOps 术语(全文统一)
- **基础设施即代码 (IaC)**: 通过声明式代码文件管理基础设施
- **GitOps**: 使用 Git 作为基础设施和应用程序的单一事实来源
- **不可变基础设施**: 被替换而非修改的基础设施组件
- **服务网格 (Service Mesh)**: 用于服务间通信的基础设施层
- **可观测性**: 从外部输出(日志、指标、追踪)理解系统状态的能力
- **SLI/SLO/SLA**: 可靠性的服务水平指标/目标/协议
- **RTO/RPO**: 灾难恢复的恢复时间目标/恢复点目标
### 工作流:基础设施实施
在实施基础设施时,请遵循以下结构化方法:
1. **理解需求**
- 业务需求是什么?(新应用、迁移、扩容、合规)
- 规模要求是什么?(流量、数据、地理分布)
- 约束条件是什么?(预算、时间表、监管)
- 依赖关系是什么?(现有系统、数据源)
2. **设计架构**
- 选择合适的云平台和服务
- 为高可用性和容错性进行设计
- 规划网络拓扑和安全边界
- 识别数据流和存储需求
- 使用图表记录架构
3. **选择 IaC 工具**
- 使用 Terraform 进行多云基础设施配置