Kubernetes(K8s) 集群搭建指南
本文详细介绍了Kubernetes集群的搭建流程,包括环境准备、系统初始化、Docker安装和K8s组件部署。重点内容涵盖:硬件配置要求、网络规划、防火墙设置、内核参数优化、Docker安装与配置、K8s组件安装以及Master节点初始化。通过阿里云镜像加速解决了国内下载问题,并提供了kubeadm初始化参数说明。文章还记录了节点加入集群的命令,为后续扩展节点做好准备。该指南帮助用户快速部署一个基
引言
Kubernetes(简称K8s)作为容器编排领域的事实标准,已成为云原生应用部署的首选平台。搭建一个稳定可靠的K8s集群是进行容器化部署和管理的基础。本文将详细介绍从环境准备到集群部署的完整流程,包括系统初始化、Docker安装、K8s组件部署、网络插件配置等关键步骤,并提供常见问题解决方案,帮助读者快速搭建属于自己的K8s集群。
一、环境准备
1.1 硬件要求
| 节点类型 | CPU | 内存 | 磁盘 | 操作系统 |
|---|---|---|---|---|
| Master | 2核+ | 4GB+ | 20GB+ | CentOS 7.8+ / Ubuntu 20.04+ |
| Node | 2核+ | 4GB+ | 20GB+ | CentOS 7.8+ / Ubuntu 20.04+ |
注意:生产环境建议至少3个Master节点和2个Node节点以保证高可用性
1.2 网络规划
本文采用以下网络配置(请根据实际环境调整):
| 节点角色 | 主机名 | IP地址 | 操作系统 |
|---|---|---|---|
| Master | master | 192.168.19.58 | CentOS 7.9 |
| Node | node1 | 192.168.19.59 | CentOS 7.9 |
| Node | node2 | 192.168.19.60 | CentOS 7.9 |
网络要求:
- 所有节点之间网络互通
- 每个节点可以访问互联网(用于下载镜像和依赖)
- 禁用Swap分区
- 开放必要端口(见1.3节)
1.3 端口要求
| 组件 | 协议 | 端口范围 | 用途 |
|---|---|---|---|
| kube-apiserver | TCP | 6443 | Kubernetes API |
| etcd | TCP | 2379-2380 | etcd客户端和对等通信 |
| kubelet | TCP | 10250 | kubelet API |
| kube-scheduler | TCP | 10259 | kube-scheduler |
| kube-controller-manager | TCP | 10257 | kube-controller-manager |
| NodePort服务 | TCP | 30000-32767 | NodePort服务范围 |
二、系统初始化(所有节点)
2.1 修改主机名
# Master节点
hostnamectl set-hostname master
# Node1节点
hostnamectl set-hostname node1
# Node2节点
hostnamectl set-hostname node2
# 使主机名立即生效
bash
2.2 配置Hosts解析
cat <<EOF >> /etc/hosts
192.168.19.58 master
192.168.19.59 node1
192.168.19.60 node2
EOF
2.3 关闭防火墙
# 临时关闭
systemctl stop firewalld
# 永久关闭
systemctl disable firewalld
# 确认防火墙状态
systemctl status firewalld # 应显示inactive
2.4 禁用SELinux
# 临时禁用
setenforce 0
# 永久禁用
sed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config
# 确认状态
getenforce # 应返回Permissive
2.5 关闭Swap分区
# 临时关闭
swapoff -a
# 永久关闭(注释掉swap行)
sed -i 's/.*swap.*/#&/' /etc/fstab
# 确认Swap已关闭
free -m # Swap行应全部为0
2.6 配置内核参数
# 配置K8s所需内核参数
cat <<EOF > /etc/sysctl.d/k8s.conf
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
net.ipv4.ip_forward = 1
vm.swappiness = 0
EOF
# 加载内核参数
sysctl --system
# 加载br_netfilter模块
modprobe br_netfilter
# 确认模块已加载
lsmod | grep br_netfilter
2.7 配置时间同步
# 安装chrony
yum install -y chrony
# 启动并设置开机自启
systemctl enable chronyd && systemctl start chronyd
# 确认时间同步状态
chronyc sources
三、安装Docker容器引擎
3.1 安装Docker依赖
# 安装所需工具
yum install -y yum-utils device-mapper-persistent-data lvm2
3.2 配置Docker阿里云源
# 添加Docker阿里云源
yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
# 更新yum缓存
yum makecache fast
3.3 安装指定版本Docker
# 查看可用Docker版本
yum list docker-ce --showduplicates | sort -r
# 安装指定版本(推荐稳定版)
yum install -y docker-ce-20.10.17-3.el7
# 启动Docker并设置开机自启
systemctl enable docker && systemctl start docker
# 确认Docker状态
systemctl status docker # 应显示active (running)
# 查看Docker版本
docker --version
3.4 配置Docker镜像加速
# 创建Docker配置目录
mkdir -p /etc/docker
# 配置阿里云镜像加速器
cat <<EOF > /etc/docker/daemon.json
{
"registry-mirrors": ["https://b9pmyelo.mirror.aliyuncs.com"],
"exec-opts": ["native.cgroupdriver=systemd"],
"log-driver": "json-file",
"log-opts": {
"max-size": "100m"
},
"storage-driver": "overlay2"
}
EOF
# 重启Docker使配置生效
systemctl daemon-reload && systemctl restart docker
四、安装Kubernetes组件
4.1 配置K8s阿里云源
cat <<EOF > /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
exclude=kubelet kubeadm kubectl
EOF
4.2 安装kubeadm、kubelet和kubectl
# 安装指定版本(1.24.x是当前稳定版)
yum install -y kubelet-1.24.10-0 kubeadm-1.24.10-0 kubectl-1.24.10-0 --disableexcludes=kubernetes
# 启动kubelet并设置开机自启
systemctl enable kubelet && systemctl start kubelet
# 确认版本
kubeadm version
kubectl version --client
五、部署Kubernetes Master节点
5.1 初始化Master节点
# 初始化集群(使用阿里云镜像仓库)
kubeadm init \
--image-repository registry.aliyuncs.com/google_containers \
--kubernetes-version v1.24.10 \
--apiserver-advertise-address=192.168.19.58 \
--pod-network-cidr=10.244.0.0/16 \
--service-cidr=10.96.0.0/12 \
--token-ttl 0
参数说明:
- –image-repository:指定镜像仓库(国内使用阿里云镜像)
- –kubernetes-version:指定K8s版本
- –apiserver-advertise-address:Master节点IP
- –pod-network-cidr:Pod网络CIDR范围(需与网络插件一致)
- –service-cidr:Service网络CIDR范围
- –token-ttl 0:token永不过期
5.2 配置kubectl
初始化成功后,按提示执行以下命令(仅Master节点):
# 配置kubectl
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config
# 测试kubectl配置
kubectl get nodes # 应显示master节点,状态为NotReady
5.3 记录加入集群命令
初始化成功后会输出Node节点加入集群的命令,请记录下来:
# 示例命令(每个人的token和hash不同)
kubeadm join 192.168.19.58:6443 \
--token abcdef.0123456789abcdef \
--discovery-token-ca-cert-hash sha256:1234567890abcdef1234567890abcdef1234567890abcdef1234567890abcdef
如果忘记记录,可以在Master节点执行以下命令重新生成:
kubeadm token create --print-join-command
六、添加Node节点到集群
6.1 在Node节点执行加入命令
在所有Node节点上执行前面记录的加入命令:
kubeadm join 192.168.19.58:6443 \
--token abcdef.0123456789abcdef \
--discovery-token-ca-cert-hash sha256:1234567890abcdef1234567890abcdef1234567890abcdef1234567890abcdef
6.2 验证节点加入状态
在Master节点执行:
kubectl get nodes
此时所有节点状态应为NotReady,这是因为还未安装网络插件。
七、安装网络插件
K8s支持多种网络插件,本文介绍两种主流选择:Calico和Flannel。
7.1 安装Calico网络插件(推荐)
# 下载Calico配置文件
wget https://docs.projectcalico.org/v3.23/manifests/calico.yaml --no-check-certificate
# 修改Pod网络CIDR(如果与初始化时不同)
# sed -i 's/192.168.0.0\/16/10.244.0.0\/16/g' calico.yaml
# 应用配置
kubectl apply -f calico.yaml
# 查看Calico Pod状态
kubectl get pods -n kube-system -l k8s-app=calico-node
7.2 安装Flannel网络插件(备选)
# 创建目录并下载配置文件
mkdir -p ~/k8s && cd ~/k8s
wget https://raw.githubusercontent.com/flannel-io/flannel/v0.17.0/Documentation/kube-flannel.yml --no-check-certificate
# 国内环境可使用以下地址
# wget https://kuboard.cn/install-script/flannel/v0.17.0/kube-flannel.yml
# 应用配置
kubectl apply -f kube-flannel.yml
# 查看Flannel Pod状态
kubectl get pods -n kube-system -l app=flannel
7.3 验证集群状态
网络插件安装完成后,等待几分钟,所有节点状态应变为Ready:
# 查看节点状态
kubectl get nodes # 所有节点STATUS应为Ready
# 查看系统组件状态
kubectl get pods -n kube-system
# 查看集群信息
kubectl cluster-info
八、部署示例应用测试集群
8.1 部署Nginx应用
# 创建Deployment
kubectl create deployment nginx --image=nginx:1.21
# 创建Service(NodePort类型)
kubectl expose deployment nginx --port=80 --type=NodePort
# 查看部署状态
kubectl get deployments
kubectl get pods
kubectl get svc nginx
8.2 访问Nginx服务
# 获取NodePort端口
NODE_PORT=$(kubectl get svc nginx -o jsonpath='{.spec.ports[0].nodePort}')
echo "Nginx NodePort: $NODE_PORT"
# 访问服务(使用任意Node节点IP)
curl http://192.168.19.59:$NODE_PORT
也可以通过浏览器访问:http://<Node节点IP>:<NodePort>
九、常见问题解决
9.1 节点状态NotReady
问题:执行kubectl get nodes显示节点状态为NotReady
解决方案:
- 检查网络插件是否正常运行:
kubectl get pods -n kube-system - 查看节点日志:
journalctl -u kubelet -f - 常见原因及解决:
- 网络插件未安装或安装失败:重新安装网络插件
- 镜像拉取失败:检查镜像仓库配置,确保能访问
- 防火墙未关闭:确认防火墙已完全关闭
9.2 初始化Master节点失败
问题:执行kubeadm init失败
解决方案:
- 重置K8s配置:
kubeadm reset -f rm -rf /etc/cni/net.d - 检查Docker状态:
systemctl status docker - 检查网络连接和镜像仓库访问:
ping mirrors.aliyun.com docker pull registry.aliyuncs.com/google_containers/pause:3.7 - 重新执行初始化命令
9.3 Node节点无法加入集群
问题:执行kubeadm join失败
解决方案:
- 检查网络连接:确保Node节点能访问Master节点的6443端口
telnet 192.168.19.58 6443 - 检查token是否有效:在Master节点执行
kubeadm token list - 如果token过期,重新生成:
kubeadm token create --print-join-command - 检查Node节点时间是否与Master同步
9.4 集群重置与卸载
如需重新部署集群,可执行以下命令清理环境:
# 在所有Node节点执行
kubeadm reset -f
rm -rf /etc/cni/net.d
systemctl restart docker
# 在Master节点执行
kubeadm reset -f
rm -rf /etc/cni/net.d $HOME/.kube
systemctl restart docker
十、集群管理与维护
10.1 安装kubectl自动补全
# 安装bash-completion
yum install -y bash-completion
# 配置kubectl补全
source <(kubectl completion bash)
echo "source <(kubectl completion bash)" >> ~/.bashrc
10.2 部署Kubernetes Dashboard
# 部署Dashboard
kubectl apply -f https://raw.githubusercontent.com/kubernetes/dashboard/v2.5.1/aio/deploy/recommended.yaml
# 创建管理员用户
kubectl create serviceaccount dashboard-admin -n kubernetes-dashboard
kubectl create clusterrolebinding dashboard-admin --clusterrole=cluster-admin --serviceaccount=kubernetes-dashboard:dashboard-admin
# 获取访问令牌
kubectl -n kubernetes-dashboard get secret $(kubectl -n kubernetes-dashboard get sa/dashboard-admin -o jsonpath="{.secrets[0].name}") -o go-template="{{.data.token | base64decode}}"
# 启动代理
kubectl proxy
通过浏览器访问:http://localhost:8001/api/v1/namespaces/kubernetes-dashboard/services/https:kubernetes-dashboard:/proxy/,使用获取的令牌登录。
十一、总结
本文详细介绍了Kubernetes集群的搭建过程,从环境准备到最终部署测试应用,涵盖了以下关键步骤:
- 环境准备:硬件要求、网络规划和操作系统配置
- 系统初始化:主机名设置、Hosts配置、防火墙和SELinux禁用
- Docker安装:配置阿里云源、安装指定版本Docker并配置加速器
- K8s组件安装:安装kubeadm、kubelet和kubectl
- Master节点部署:初始化集群和配置kubectl
- Node节点加入:执行加入命令并验证
- 网络插件安装:Calico和Flannel两种选择
- 集群验证:部署测试应用并访问
通过本文的步骤,您可以搭建一个功能完善的K8s集群。对于生产环境,建议:
- 部署3个Master节点实现高可用
- 使用负载均衡器分发API Server流量
- 配置持久化存储(如Ceph、NFS)
- 实现集群监控(如Prometheus + Grafana)
- 配置备份策略
Kubernetes生态系统丰富,后续可以进一步学习Helm、Ingress、StatefulSet等高级特性,深入掌握容器编排和云原生应用开发。
更多推荐


所有评论(0)