오늘 이야기 드릴 내용은 A100카드를 장착한 장비에 NVIDIA DRIVER가 정상 설치 안될 경우 확인해야할 체크사항 입니다.
1. NVIDIA 드라이버
아래 표와 같이 Ampere카드는 450.36.06+ 드라이버를 설치해야 합니다
2. Kernel Version
드라이버를 설치할 때 꼭 확인해야할 것중 하나가 바로 커널 버전입니다.
ubuntu 기준 지원하고 있는 커널버전은 5.4.x 입니다. ubuntu os 최신버전을(20.04.2) 설치하면 기본적으로 5.8.x 커널이 설치되어 있습니다. 따라서 20.04.2 보다 아래 버전의 OS를 설치하거나 커널버전을 수동으로 다운그레이드 해야 합니다.
(ubuntu 에서 " apt upgrade " 입력시 자동으로 커널버전을 최신으로 업데이트 하기 때문에 주의가 필요)
3. Bios Re size bar support
간혹가다 장비 BIOS 설정에 Bios Re size bar support가 disable 되있는 경우가 있는데 enable 해야 드라이버가 정상 작동 합니다.
4. lspci 명령어
아래 명령어를 입력해 서버에서 GPU카드를 정상 인식하는지 확인 합니다.
$ lspci |grep -i nvidia
'NVIDIA' 카테고리의 다른 글
CUDA 버전별 호환성 (0) | 2021.04.07 |
---|---|
DGX OS 소개 (0) | 2021.04.07 |
AMD EPYC 7002 시리즈 분석 (0) | 2020.09.28 |
DGX A100의 특징을 알아보자 !! (0) | 2020.09.28 |