Machine learning

[nvidia driver 에러] error running hook: exit status 1, stdout: , stderr: nvidia-container-cli: initialization error: nvml error: driver not loaded: unknown.

South Korea life 2022. 3. 23. 18:00
728x90
반응형

한동안 리눅스 PC를 잘 세팅해서 사용하고 있었는데, 오늘 갑자기 에러가 발생했습니다. 처음에 노트북에 NVIDIA driver 설정하기 전, 자주 보던 error였습니다.

NVIDIA driver 관련 에러 로그

NVIDIA driver 설치를 벌써 몇번째 다시하는지 기억도 안납니다;;; 오늘 또 nvidia driver를 다시 설치해줬습니다. 우선 nvidia 홈페이지에 가서, 제 그래픽 카드에 맞는 nvidia driver를 다시 다운받았습니다.

NVIDIA driver download

다운받은 .run 확장자 파일을 실행시켜줍니다.

다운받은 run 파일 실행

파일을 실행하면, 다른 설치 방법으로 진행할수도 있는데 현재 방법으로 계속 진행할 것인지 묻습니다. 저는 계속 진행했습니다.

NVIDIA driver 설치 화면
NVIDIA driver 설치 중

NVIDIA driver 설치 중에, cryptographic signiture 관련 sign을 할 것인지 안할것인지 묻습니다. 처음에는 'Install without signing'을 선택했습니다. 근데 에러가 나오면서 설치가 중단되길래, 'Sign the kernel module' 옵션으로 바꾸어서 설치를 진행하였습니다.

NVIDIA driver 설치 중

새로운 key pair를 만들건지 기존에 key pair를 사용할 것인지 묻는데, 기존 key pair가 기억나지 않아서 새로 key pair를 만들었습니다.

NVIDIA driver 설치 중 - Generate a new key pair

키 생성 후, 남은 부분들도 마저 설치를 해주었습니다. 또한, nvidia-xconfig utility도 자동으로 업데이트하게 해놓았습니다.

NVIDIA driver 설치 중 - nvidia-xconfig utility

최종적으로 아래와 같은 화면을 볼 수 있습니다.

NVIDIA driver 설치 완료

이제 다시 NVIDIA driver가 정상적으로 설치되었다고 생각했습니다... 그래서 기쁜 마음으로 재부팅 후, nvidia-smi를 커맨드 창에 입력한 순간... 다시 같은 에러 로그를 확인할 수 있었습니다...

NVIDIA driver 설치 후... 바로 만난 error 로그

그래서, 방금 설치 한 nvidia driver를 다시 삭제 후, 재설치를 진행하였습니다.

# NVIDIA driver 삭제

sudo apt-get purge nvidia*

sudo apt-get autoremove
sudo apt-get autoclean
sudo rm -rf /usr/local/cuda*

 

근데 하나 이상한게, 'sudo apt-get purge nvidia*'를 커맨드 창에 입력한 순간, 아래 화면과 같이 어떠한 관련 패키지도 설치가 되지 않았다고 나왔습니다... 그래서 혹시나 싶어, 이 상태에서 nvidia driver를 다른 방법으로 다시 설치를 진행해보기로 했습니다.

sudo apt-get purge nvidia* 실행시 출력 로그

sudo ubuntu-drivers devices 커맨드를 활용해서, 설치 가능한 nvidia-driver들을 확인해보았습니다.

sudo ubuntu-drivers devices

NVIDIA driver 추천 (ubuntu-drivers devices 실행 시 화면)

 

nvidia-driver-510을 추천해주므로, 해당 버전을 설치 진행하였습니다.

sudo apt install nvidia-driver-510

설치 진행 중, secure boot 관련 내용이 나옵니다. 'OK'를 해줍니다.

Secure boot 내용 확인

secure boot관련 password를 입력해줍니다.

NVIDIA driver secure boot관련 password 입력

재부팅을 하니, MOK management란 창이 파랗게 뜹니다.

MOK management

Enroll MOK을 선택 후, key를 확인하고 싶다면 view key 0를 선택해서 확인해봅니다. 확인이 필요없다면 바로 'continue'를 선택하고 나머지 과정을 진행합니다.

MOK management - View key 0, continue

Continue를 선택하면 password를 입력하라는 창이 뜹니다. 아까 전에 secure boot관련 입력했던 password를 입력해줍니다.

MOK management - password 입력 화면

패스워드 입력 후, 다시 재 부팅해줍니다.

MOK management - reboot

재부팅 후, nvidia-smi를 입력하니 그래픽카드 드라이버가 정상적으로 설치된 것을 확인할 수 있었습니다.

NVIDIA driver 설치 확인

이 작업을 하다보니, 벌써 오후 6시가 가까워옵니다... 내일 다시 다른 작업들을 시작해야겠습니다.

728x90
반응형