GPU 서버들의 CUDA 버전이 낮아, pytorch, tensorflow 등 ML 개발을 위한 프레임워크들의 버전을 올릴 수 없었습니다.K8S 클러스터를 업그레이드 하면서 GPU 서버의 환경설정을 다시 하여 전체적인 버전을 올리기로 결정하였습니다.다만, OS 는 ubuntu 18.04 버전을 그대로 사용하고 있어, 완전 최신버전으로 올릴 순 없었습니다. 전체 작업 목차삭제nvidia-driver 설치cuda 설치cuDNN 설치docker, containerd 설치nvidia-container-toolkit 설치container 서비스 설정 & K8S 설정K8S 클러스터에서 cuda 인식을 위한 작업작업 전 배경지식작업 전, nvidia GPU 서버에 설치되는 환경들에 대한 이해가 필요합니다. 이해를 돕..