[ PROMPT_NODE_24910 ]
infrastructure
[ SKILL_DOCUMENTATION ]
# 基础设施管理
服务器管理、网络运维、容量规划及 IT 团队基础设施运维的综合指南。
## 目录
- [服务器管理](#server-management)
- [网络运维](#network-operations)
- [容量规划](#capacity-planning)
- [存储管理](#storage-management)
- [虚拟化](#virtualization)
- [云基础设施](#cloud-infrastructure)
- [基础设施即代码](#infrastructure-as-code)
- [补丁与更新](#patching-and-updates)
- [性能优化](#performance-optimization)
- [成本管理](#cost-management)
## 服务器管理
### 服务器生命周期
yaml
阶段 1:采购
操作:
- 定义需求(CPU、内存、存储、网络)
- 选择供应商(Dell, HP, Lenovo 等)
- 购买或租赁决策
- 订购硬件
时间线:4-12 周
阶段 2:配置
操作:
- 接收并盘点硬件
- 上架并连接服务器线缆
- 安装操作系统
- 应用基准配置
- 安装监控代理
- 在 CMDB 中记录
时间线:每台服务器 1-2 天
阶段 3:部署
操作:
- 安装应用软件
- 配置网络和防火墙规则
- 设置备份
- 负载均衡器配置
- 运行验收测试
- 移交给应用团队
时间线:2-5 天
阶段 4:运维 (2-5 年)
操作:
- 监控性能和健康状况
- 应用安全补丁
- 执行维护
- 容量规划
- 事故响应
时间线:典型硬件生命周期 2-5 年
阶段 5:退役
操作:
- 将工作负载迁移到新服务器
- 备份所有数据
- 擦除驱动器(安全擦除)
- 从监控中移除
- 更新 CMDB
- 物理处置或退回
时间线:1-2 周
### 操作系统管理
**Linux 服务器设置 (Ubuntu/RHEL)**:
bash
#!/bin/bash
# 服务器基准配置脚本
set -e
echo "=== 服务器基准配置 ==="
# 1. 系统更新
echo "更新系统包..."
apt-get update && apt-get upgrade -y # Ubuntu/Debian
# yum update -y # RHEL/CentOS
# 2. 设置主机名
HOSTNAME="web-server-01.example.com"
hostnamectl set-hostname $HOSTNAME
echo "主机名已设置为: $HOSTNAME"
# 3. 配置 NTP 进行时间同步
echo "配置 NTP..."
timedatectl set-timezone UTC
apt-get install -y chrony
systemctl enable chrony
systemctl start chrony
# 4. 配置