Where there is a will,
there is a way

dev/linux

[docker] "Failed to initialize NVML: Unknown Error"

낭만석사김사부 2024. 5. 16. 10:11
반응형

문제

어느날 갑자기 컨테이너 내에 잡혔던 GPU드라이버가 갑자기 안잡혔을때 해결하는 방식입니다

 

해결방법

host 시스템 (컨테이너 밖)에서 다음 명령어를 입력합니다.

sudo nano /etc/docker/daemon.json  

 

파일 내에 아래 문구를 추가합니다.

"exec-opts": ["native.cgroupdriver=cgroupfs"] 

 

예시로 아래와 유사하게 수정하면 됩니다.

{  
   "runtimes": {  
       "nvidia": {  
           "args": [],  
           "path": "nvidia-container-runtime"  
       }  
   },  
   "exec-opts": ["native.cgroupdriver=cgroupfs"]  

 

마지막으로, 도커를 재시작합니다.

sudo service docker restart

 

다시 컨테이너를 열어보면, nvidia 드라이버가 잘 잡힙니다!

 

 

참조: https://stackoverflow.com/questions/72932940/failed-to-initialize-nvml-unknown-error-in-docker-after-few-hours

반응형