1. 规划集群架构
- 控制平面节点(Masters) :至少部署3个控制平面节点以实现高可用性。
- 工作节点(Workers) :数量根据负载需求决定。
- 负载均衡器:至少1个,用于分发流量至多个控制平面节点。
2. 前期环境准备
- 确保所有节点系统时间一致。
- 关闭Swap分区。
- 设置主机名并在所有节点更新
/etc/hosts
文件以确保节点间能够通过主机名互相通信。
- 确保每个节点的网络配置允许所需端口通信。
- 安装必要的软件,如
docker
或 containerd
容器运行时和 kubelet
、kubeadm
、kubectl
工具集。
3. 配置负载均衡器
- 配置TCP转发规则,将API服务器端口(默认是6443)的流量分发到所有控制平面节点。
- 测试负载均衡器确保配置正确。
4. 初始化第一个控制平面节点
- 使用
kubeadm init
命令初始化集群。指定负载均衡器地址作为API服务器的地址,并为API服务器指定VIP(虚拟IP)。
- 配置kubectl访问:将
/etc/kubernetes/admin.conf
复制到 ~/.kube/config
。
5. 加入其他控制平面节点
- 使用由
kubeadm init
生成的 kubeadm join
命令来将额外的控制平面节点加入集群。
- 对于每个新节点,使用
--control-plane
标志和指定同样的VIP地址。
6. 安装网络插件
- 在控制平面上安装网络插件,如Calico、Flannel或Weave。
- 确保网络插件支持多控制平面节点配置。
7. 加入工作节点
- 使用
kubeadm join
命令将工作节点加入到集群,也是使用之前 kubeadm init
过程中生成的指令。
- 在工作节点上不需要
--control-plane
标志。
8. 验证集群状态
- 使用
kubectl get nodes
和 kubectl get pods --all-namespaces
检查所有节点和Pods的状态。
- 确保所有控制平面和工作节点都显示为
Ready
状态。
9. 实施备份和恢复计划
- 定期备份etcd数据。
- 实施集群资源(如配置和服务)的备份策略。
10. 配置监控和日志
- 安装监控工具,如Prometheus,和日志聚合工具,如Elasticsearch和Kibana。
- 监控集群性能并配置告警。
11. 开启集群自动升级和维护策略
12. 应用安全策略
- 配置网络策略和Pod安全策略。
- 定期更新和打补丁以确保安全。