kubernetes初始化失败_kubernetes 1.28.2部署初始化失败

编程之家80 更新时间：2026-04-03 16:36:59

1. 彻底清理 Kubernetes 残留痕迹

原因：
残留的配置文件、静态 Pod 清单和网络配置会导致初始化冲突。 kubeadm reset 可能未完全清理环境。

操作：

# 重置 kubeadm 并强制清理
sudo kubeadm reset -f
# 手动删除所有残留文件
sudo rm -rf \
  /etc/kubernetes \
  /var/lib/etcd \
  /var/lib/kubelet \
  /etc/cni/net.d \
  /etc/systemd/system/kubelet.service.d \
  $HOME/.kube
# 强制删除可能残留的静态 Pod 清单（关键！）
sudo find /etc/kubernetes/manifests -type f -name '*.yaml' -delete

2. 解除端口 10250 占用

原因：
端口被占用通常由未完全退出的 kubelet 或残留容器引起。

操作：

# 查找并终止占用 10250 端口的进程
sudo ss -tulnp | grep 10250
sudo kill -9 <PID>  # 根据输出结果替换 <PID>
# 确保 kubelet 完全停止
sudo systemctl stop kubelet
# 清理容器运行时残留
sudo crictl rm -f $(sudo crictl ps -aq) 2>/dev/null

3. 修复 kubelet 服务配置

原因：
cgroup 驱动不一致或证书错误会导致 kubelet 无法启动。

操作：

# 检查 kubelet 配置
sudo grep cgroupDriver /var/lib/kubelet/config.yaml
# 如果输出不是 `systemd`，修复配置
sudo sed -i 's/cgroupDriver: cgroupfs/cgroupDriver: systemd/' /var/lib/kubelet/config.yaml
# 重启服务
sudo systemctl daemon-reload
sudo systemctl restart kubelet

4. 验证容器运行时 (containerd) 配置

原因：
containerd 的 cgroup 驱动或镜像仓库配置错误会导致控制平面组件无法启动。

操作：

# 确认 containerd 使用 systemd cgroup 驱动
sudo grep SystemdCgroup /etc/containerd/config.toml
# 输出应为：SystemdCgroup = true
# 如果未配置，修复后重启
sudo sed -i 's/SystemdCgroup = false/SystemdCgroup = true/' /etc/containerd/config.toml
sudo systemctl restart containerd
# 手动拉取镜像测试
sudo crictl pull registry.aliyuncs.com/google_containers/kube-apiserver:v1.27.16

5. 使用强制模式重新初始化集群

原因：
标准初始化流程可能被残留配置干扰，需强制覆盖。

操作：

# 初始化命令（添加 --ignore-preflight-errors 跳过残留文件检查）
sudo kubeadm init \
  --config kubeadm-config.yaml \
  --upload-certs \
  --ignore-preflight-errors=FileAvailable--etc-kubernetes-manifests-*
# 如果仍报端口占用，强制释放
sudo lsof -i :10250 | awk 'NR!=1 {print $2}' | xargs sudo kill -9

6. 关键配置验证

检查项	命令	预期结果
kubelet 服务状态	`systemctl status kubelet`	`Active: active (running)`
控制平面容器状态	`crictl ps \| grep 'kube-apiserver'`	所有组件处于 `Running` 状态
端口占用情况	`ss -tulnp \| grep 10250`	无输出
镜像完整性	`crictl images \| grep 'google_containers'`	显示所有 v1.27.16 版本镜像

后续步骤

部署网络插件 （如 Calico）：
kubectl apply -f

恢复环境 ：

mkdir -p $HOME/.kube
sudo cp /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

若仍失败：深度排查

查看 kubelet 详细日志：

journalctl -xeu kubelet --no-pager | grep -i -E "error|fail|crash"

检查控制平面组件日志：

crictl ps -a | grep -E "kube-apiserver|etcd"
crictl logs <CONTAINER_ID>

使用调试模式初始化：

kubeadm init --v=5  # 输出级别调至最高

本文发布于:2026-03-20，感谢您对本站的认可！

本文链接:https://www.fzithome.com/biancheng/1774009003a2707453.html

kubernetes初始化失败_kubernetes 1.28.2部署初始化失败

1. 彻底清理 Kubernetes 残留痕迹

2. 解除端口 10250 占用

3. 修复 kubelet 服务配置

4. 验证容器运行时 (containerd) 配置

5. 使用强制模式重新初始化集群

6. 关键配置验证

后续步骤

若仍失败：深度排查

发布评论取消回复

最近发表

相关推荐

标签列表

kubernetes初始化失败_kubernetes 1.28.2部署初始化失败

1. 彻底清理 Kubernetes 残留痕迹

2. 解除端口 10250 占用

3. 修复 kubelet 服务配置

4. 验证容器运行时 (containerd) 配置

5. 使用强制模式重新初始化集群

6. 关键配置验证

后续步骤

若仍失败：深度排查

发布评论 取消回复

最近发表

相关推荐

标签列表

发布评论取消回复