常用命令
# 获取 pod、service、statefulset kubectl get all # 获取 k8s 集群节点 kubectl get nodes # 获取默认名称空间下的 pod kubectl get pods # 获取所有名称空间下的 pod kubectl get pods -A # 查看名为 yeemongo-0 的 pod 具体信息 kubectl describe pod yeemongo-0 # 查看名为 xxx 的 node 具体信息 kubectl describe node xxx # 删除 kube-system 名称空间下名称为 coredns-9b8 的 pod kubectl delete pod coredns-9b8 --namespace=kube-system
两节点集群部署(policy 和 storm )
# 第一步:master 节点上生成 'microk8s.join xxx' 命令 microk8s.add-node # 第二步:slave 节点执行生成的命令,加入集群 microk8s.join 192.168.3.220:25000/czJVpyYbQRxKgegoncdOhysBCMMMnmjy # 列出 node 节点 kubectl get nodes # 删除集群中的节点: kubectl delete node <node-name>
storm节点 /var 下磁盘满,导致执行 microk8s.join 失败,storm pod 一个都没起来
客户那启动 storm 节点,发现一个 pod 都没起来,都是 pending 状态。执行 kubectl describe node 192.168.3.222 后有磁盘不足导致的GC问题。尝试从集群中删除 storm 节点后重新加入,microk8s.join 命令却报错:No space left on device: ‘/var/snap/microk8s/1253/args/flanneld..remote’。
最后删除 /var/log/ 下的 boot.log 和 messages 文件,重启 storm 解决问题。因 boot.log 和 messages 文件特别大合起来20GB,把磁盘空间都耗尽了,里面存储了一大堆设备发过来的 syslog日志,这是问题所在。