引言

Kubernetes(简称K8s)作为容器编排领域的事实标准,已成为云原生应用部署的首选平台。搭建一个稳定可靠的K8s集群是进行容器化部署和管理的基础。本文将详细介绍从环境准备到集群部署的完整流程,包括系统初始化、Docker安装、K8s组件部署、网络插件配置等关键步骤,并提供常见问题解决方案,帮助读者快速搭建属于自己的K8s集群。

一、环境准备

1.1 硬件要求

节点类型 CPU 内存 磁盘 操作系统
Master 2核+ 4GB+ 20GB+ CentOS 7.8+ / Ubuntu 20.04+
Node 2核+ 4GB+ 20GB+ CentOS 7.8+ / Ubuntu 20.04+

注意:生产环境建议至少3个Master节点和2个Node节点以保证高可用性

1.2 网络规划

本文采用以下网络配置(请根据实际环境调整):

节点角色 主机名 IP地址 操作系统
Master master 192.168.19.58 CentOS 7.9
Node node1 192.168.19.59 CentOS 7.9
Node node2 192.168.19.60 CentOS 7.9

网络要求:

  • 所有节点之间网络互通
  • 每个节点可以访问互联网(用于下载镜像和依赖)
  • 禁用Swap分区
  • 开放必要端口(见1.3节)

1.3 端口要求

组件 协议 端口范围 用途
kube-apiserver TCP 6443 Kubernetes API
etcd TCP 2379-2380 etcd客户端和对等通信
kubelet TCP 10250 kubelet API
kube-scheduler TCP 10259 kube-scheduler
kube-controller-manager TCP 10257 kube-controller-manager
NodePort服务 TCP 30000-32767 NodePort服务范围

二、系统初始化(所有节点)

2.1 修改主机名

# Master节点
hostnamectl set-hostname master

# Node1节点
hostnamectl set-hostname node1

# Node2节点
hostnamectl set-hostname node2

# 使主机名立即生效
bash

2.2 配置Hosts解析

cat <<EOF >> /etc/hosts
192.168.19.58 master
192.168.19.59 node1
192.168.19.60 node2
EOF

2.3 关闭防火墙

# 临时关闭
systemctl stop firewalld

# 永久关闭
systemctl disable firewalld

# 确认防火墙状态
systemctl status firewalld  # 应显示inactive

2.4 禁用SELinux

# 临时禁用
setenforce 0

# 永久禁用
sed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config

# 确认状态
getenforce  # 应返回Permissive

2.5 关闭Swap分区

# 临时关闭
swapoff -a

# 永久关闭(注释掉swap行)
sed -i 's/.*swap.*/#&/' /etc/fstab

# 确认Swap已关闭
free -m  # Swap行应全部为0

2.6 配置内核参数

# 配置K8s所需内核参数
cat <<EOF > /etc/sysctl.d/k8s.conf
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
net.ipv4.ip_forward = 1
vm.swappiness = 0
EOF

# 加载内核参数
sysctl --system

# 加载br_netfilter模块
modprobe br_netfilter

# 确认模块已加载
lsmod | grep br_netfilter

2.7 配置时间同步

# 安装chrony
yum install -y chrony

# 启动并设置开机自启
systemctl enable chronyd && systemctl start chronyd

# 确认时间同步状态
chronyc sources

三、安装Docker容器引擎

3.1 安装Docker依赖

# 安装所需工具
yum install -y yum-utils device-mapper-persistent-data lvm2

3.2 配置Docker阿里云源

# 添加Docker阿里云源
yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo

# 更新yum缓存
yum makecache fast

3.3 安装指定版本Docker

# 查看可用Docker版本
yum list docker-ce --showduplicates | sort -r

# 安装指定版本(推荐稳定版)
yum install -y docker-ce-20.10.17-3.el7

# 启动Docker并设置开机自启
systemctl enable docker && systemctl start docker

# 确认Docker状态
systemctl status docker  # 应显示active (running)

# 查看Docker版本
docker --version

3.4 配置Docker镜像加速

# 创建Docker配置目录
mkdir -p /etc/docker

# 配置阿里云镜像加速器
cat <<EOF > /etc/docker/daemon.json
{
  "registry-mirrors": ["https://b9pmyelo.mirror.aliyuncs.com"],
  "exec-opts": ["native.cgroupdriver=systemd"],
  "log-driver": "json-file",
  "log-opts": {
    "max-size": "100m"
  },
  "storage-driver": "overlay2"
}
EOF

# 重启Docker使配置生效
systemctl daemon-reload && systemctl restart docker

四、安装Kubernetes组件

4.1 配置K8s阿里云源

cat <<EOF > /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
exclude=kubelet kubeadm kubectl
EOF

4.2 安装kubeadm、kubelet和kubectl

# 安装指定版本(1.24.x是当前稳定版)
yum install -y kubelet-1.24.10-0 kubeadm-1.24.10-0 kubectl-1.24.10-0 --disableexcludes=kubernetes

# 启动kubelet并设置开机自启
systemctl enable kubelet && systemctl start kubelet

# 确认版本
kubeadm version
kubectl version --client

五、部署Kubernetes Master节点

5.1 初始化Master节点

# 初始化集群(使用阿里云镜像仓库)
kubeadm init \
  --image-repository registry.aliyuncs.com/google_containers \
  --kubernetes-version v1.24.10 \
  --apiserver-advertise-address=192.168.19.58 \
  --pod-network-cidr=10.244.0.0/16 \
  --service-cidr=10.96.0.0/12 \
  --token-ttl 0

参数说明

  • –image-repository:指定镜像仓库(国内使用阿里云镜像)
  • –kubernetes-version:指定K8s版本
  • –apiserver-advertise-address:Master节点IP
  • –pod-network-cidr:Pod网络CIDR范围(需与网络插件一致)
  • –service-cidr:Service网络CIDR范围
  • –token-ttl 0:token永不过期

5.2 配置kubectl

初始化成功后,按提示执行以下命令(仅Master节点):

# 配置kubectl
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

# 测试kubectl配置
kubectl get nodes  # 应显示master节点,状态为NotReady

5.3 记录加入集群命令

初始化成功后会输出Node节点加入集群的命令,请记录下来:

# 示例命令(每个人的token和hash不同)
kubeadm join 192.168.19.58:6443 \
  --token abcdef.0123456789abcdef \
  --discovery-token-ca-cert-hash sha256:1234567890abcdef1234567890abcdef1234567890abcdef1234567890abcdef

如果忘记记录,可以在Master节点执行以下命令重新生成:

kubeadm token create --print-join-command

六、添加Node节点到集群

6.1 在Node节点执行加入命令

在所有Node节点上执行前面记录的加入命令:

kubeadm join 192.168.19.58:6443 \
  --token abcdef.0123456789abcdef \
  --discovery-token-ca-cert-hash sha256:1234567890abcdef1234567890abcdef1234567890abcdef1234567890abcdef

6.2 验证节点加入状态

在Master节点执行:

kubectl get nodes

此时所有节点状态应为NotReady,这是因为还未安装网络插件。

七、安装网络插件

K8s支持多种网络插件,本文介绍两种主流选择:Calico和Flannel。

7.1 安装Calico网络插件(推荐)

# 下载Calico配置文件
wget https://docs.projectcalico.org/v3.23/manifests/calico.yaml --no-check-certificate

# 修改Pod网络CIDR(如果与初始化时不同)
# sed -i 's/192.168.0.0\/16/10.244.0.0\/16/g' calico.yaml

# 应用配置
kubectl apply -f calico.yaml

# 查看Calico Pod状态
kubectl get pods -n kube-system -l k8s-app=calico-node

7.2 安装Flannel网络插件(备选)

# 创建目录并下载配置文件
mkdir -p ~/k8s && cd ~/k8s
wget https://raw.githubusercontent.com/flannel-io/flannel/v0.17.0/Documentation/kube-flannel.yml --no-check-certificate

# 国内环境可使用以下地址
# wget https://kuboard.cn/install-script/flannel/v0.17.0/kube-flannel.yml

# 应用配置
kubectl apply -f kube-flannel.yml

# 查看Flannel Pod状态
kubectl get pods -n kube-system -l app=flannel

7.3 验证集群状态

网络插件安装完成后,等待几分钟,所有节点状态应变为Ready:

# 查看节点状态
kubectl get nodes  # 所有节点STATUS应为Ready

# 查看系统组件状态
kubectl get pods -n kube-system

# 查看集群信息
kubectl cluster-info

八、部署示例应用测试集群

8.1 部署Nginx应用

# 创建Deployment
kubectl create deployment nginx --image=nginx:1.21

# 创建Service(NodePort类型)
kubectl expose deployment nginx --port=80 --type=NodePort

# 查看部署状态
kubectl get deployments
kubectl get pods
kubectl get svc nginx

8.2 访问Nginx服务

# 获取NodePort端口
NODE_PORT=$(kubectl get svc nginx -o jsonpath='{.spec.ports[0].nodePort}')
echo "Nginx NodePort: $NODE_PORT"

# 访问服务(使用任意Node节点IP)
curl http://192.168.19.59:$NODE_PORT

也可以通过浏览器访问:http://<Node节点IP>:<NodePort>

九、常见问题解决

9.1 节点状态NotReady

问题:执行kubectl get nodes显示节点状态为NotReady

解决方案

  1. 检查网络插件是否正常运行:
    kubectl get pods -n kube-system
    
  2. 查看节点日志:
    journalctl -u kubelet -f
    
  3. 常见原因及解决:
    • 网络插件未安装或安装失败:重新安装网络插件
    • 镜像拉取失败:检查镜像仓库配置,确保能访问
    • 防火墙未关闭:确认防火墙已完全关闭

9.2 初始化Master节点失败

问题:执行kubeadm init失败

解决方案

  1. 重置K8s配置:
    kubeadm reset -f
    rm -rf /etc/cni/net.d
    
  2. 检查Docker状态:
    systemctl status docker
    
  3. 检查网络连接和镜像仓库访问:
    ping mirrors.aliyun.com
    docker pull registry.aliyuncs.com/google_containers/pause:3.7
    
  4. 重新执行初始化命令

9.3 Node节点无法加入集群

问题:执行kubeadm join失败

解决方案

  1. 检查网络连接:确保Node节点能访问Master节点的6443端口
    telnet 192.168.19.58 6443
    
  2. 检查token是否有效:在Master节点执行
    kubeadm token list
    
  3. 如果token过期,重新生成:
    kubeadm token create --print-join-command
    
  4. 检查Node节点时间是否与Master同步

9.4 集群重置与卸载

如需重新部署集群,可执行以下命令清理环境:

# 在所有Node节点执行
kubeadm reset -f
rm -rf /etc/cni/net.d
systemctl restart docker

# 在Master节点执行
kubeadm reset -f
rm -rf /etc/cni/net.d $HOME/.kube
systemctl restart docker

十、集群管理与维护

10.1 安装kubectl自动补全

# 安装bash-completion
yum install -y bash-completion

# 配置kubectl补全
source <(kubectl completion bash)
echo "source <(kubectl completion bash)" >> ~/.bashrc

10.2 部署Kubernetes Dashboard

# 部署Dashboard
kubectl apply -f https://raw.githubusercontent.com/kubernetes/dashboard/v2.5.1/aio/deploy/recommended.yaml

# 创建管理员用户
kubectl create serviceaccount dashboard-admin -n kubernetes-dashboard
kubectl create clusterrolebinding dashboard-admin --clusterrole=cluster-admin --serviceaccount=kubernetes-dashboard:dashboard-admin

# 获取访问令牌
kubectl -n kubernetes-dashboard get secret $(kubectl -n kubernetes-dashboard get sa/dashboard-admin -o jsonpath="{.secrets[0].name}") -o go-template="{{.data.token | base64decode}}"

# 启动代理
kubectl proxy

通过浏览器访问:http://localhost:8001/api/v1/namespaces/kubernetes-dashboard/services/https:kubernetes-dashboard:/proxy/,使用获取的令牌登录。

十一、总结

本文详细介绍了Kubernetes集群的搭建过程,从环境准备到最终部署测试应用,涵盖了以下关键步骤:

  1. 环境准备:硬件要求、网络规划和操作系统配置
  2. 系统初始化:主机名设置、Hosts配置、防火墙和SELinux禁用
  3. Docker安装:配置阿里云源、安装指定版本Docker并配置加速器
  4. K8s组件安装:安装kubeadm、kubelet和kubectl
  5. Master节点部署:初始化集群和配置kubectl
  6. Node节点加入:执行加入命令并验证
  7. 网络插件安装:Calico和Flannel两种选择
  8. 集群验证:部署测试应用并访问

通过本文的步骤,您可以搭建一个功能完善的K8s集群。对于生产环境,建议:

  • 部署3个Master节点实现高可用
  • 使用负载均衡器分发API Server流量
  • 配置持久化存储(如Ceph、NFS)
  • 实现集群监控(如Prometheus + Grafana)
  • 配置备份策略

Kubernetes生态系统丰富,后续可以进一步学习Helm、Ingress、StatefulSet等高级特性,深入掌握容器编排和云原生应用开发。

Logo

开源鸿蒙跨平台开发社区汇聚开发者与厂商,共建“一次开发,多端部署”的开源生态,致力于降低跨端开发门槛,推动万物智联创新。

更多推荐