해당 내용은 Udemy의 Certified Kubernetes Administrator (CKA) with Practice Tests 강의를 공부한 내용입니다. 내용을 그대로 번역하기보다는, 제가 이해하기 쉬운 대로 수정한 부분들이 있습니다.
⚠️ 영어 독해가 많이 부족합니다. 틀린 내용이 있으면 알려주시면 감사하겠습니다.
이번 강의에서는 control plane 장애를 해결하는 다양한 방법을 살펴보겠습니다.
먼저 클러스터에 있는 노드의 상태를 확인하여 모두 정상인지 확인합니다.
kubectl get nodes
그런 다음 클러스터에서 실행 중인 파드의 상태를 확인합니다.
kubectl get pods
Kubeadm 도구로 배포된 클러스터의 경우, 컨트롤 플레인 컴포넌트가 파드로 배포된 경우, kube-system 네임 스페이스에 있는 파드가 실행 중인지 확인할 수 있습니다.
kubectl get pods -n kube-system
또는 우리의 경우처럼 컨트롤 플레인 컴포넌트가 서비스로 배포된 경우라면 마스터 노드에서 kube API 서버, 컨트롤러 매니저 및 스케줄러, 워커 노드에서 kubelet 및 kube 프록시 서비스와 같은 서비스 상태를 모두 확인해야 합니다.
다음으로 컨트롤 플레인 컴포넌트의 로그를 확인합니다. 마찬가지로 kubeadm의 경우, 컨트롤 플레인 컴포넌트를 호스팅하는 파드의 로그를 보려면 kubectl logs 커맨드를 사용합니다.
kubectl logs kube-apiserver-master -n kube-system
마스터 노드에 기본적으로 구성된 서비스의 경우, 호스트 로깅 솔루션을 사용하여 서비스 로그를 확인합니다. 우리의 경우, journalctl 유틸리티를 사용하여 kube API 서버의 로그를 볼 수 있습니다.
'MLOps > Doker & Kubernetes' 카테고리의 다른 글
Udemy CKA 강의 정리 257: Network Troubleshooting (0) | 2023.02.01 |
---|---|
Udemy CKA 강의 정리 254: Worker Node Failure (0) | 2023.02.01 |
Udemy CKA 강의 정리 248: Application Failure (0) | 2023.01.30 |
Udemy CKA 강의 정리 247: Download Presentation Deck (0) | 2023.01.28 |
Udemy CKA 강의 정리 246: Troubleshooting - Section Introduction (0) | 2023.01.28 |
댓글