banner
CedricXu

CedricXu

计科学生 / 摄影爱好者

令人抓狂的顯卡驅動程式

引言#

安裝顯卡驅動其實很簡單

這篇文章主要記錄了一次耗時一個多月的令人抓狂的顯卡驅動安裝過程(最後發現是顯卡壞了),以及我在這個過程中的一些感悟

tri0m

背景#

書接上回,我在用 1500 元安裝了一台電腦之後,為了能在我的深度學習導論課上使用我的伺服器,我迫切需要一張計算卡,於是在海鮮市場下單了一張 P104-100,從此我的噩夢般的顯卡裝驅動之旅開始了

f84pq

驅動安裝過程#

第一次嘗試#

在拿到顯卡的第一時間,我直接嘗試了 PPA 安裝驅動,首先添加apt倉庫

sudo add-apt-repository ppa:micahflee/ppa
sudo apt update

然後使用ubuntu-drivers命令安裝推薦的驅動

❯ ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.1/0000:10:00.0 ==
modalias : pci:v000010DEd00001B87sv000010DEsd00001237bc03sc02i00
vendor   : NVIDIA Corporation
model    : GP104 [P104-100]
driver   : nvidia-driver-470-server - distro non-free
driver   : nvidia-driver-390 - distro non-free
driver   : nvidia-driver-545 - third-party non-free
driver   : nvidia-driver-525 - distro non-free
driver   : nvidia-driver-535-server - distro non-free
driver   : nvidia-driver-470 - distro non-free
driver   : nvidia-driver-525-server - distro non-free
driver   : nvidia-driver-450-server - distro non-free
driver   : nvidia-driver-535 - distro non-free recommended
driver   : nvidia-driver-418-server - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin

可以看到推薦的是nvidia-driver-535,直接安裝

sudo apt install nvidia-driver-455
sudo reboot

或者使用

sudo ubuntu-drivers autoinstall

也可以達到上面的效果

這時顯卡驅動安裝過程理應結束了,現在可以正常使用這張顯卡(事實證明,如果顯卡是好的確實是這樣),但是我在運行Nvidia-smi之後卻報錯了

❯ nvidia-smi
No devices were found

在進行搜索後發現可能是主板的問題,於是我檢查主板,設置 CPU 集顯為默認顯卡,同時檢查Above 4G Decoding選項處於開啟狀態,但是並沒有解決問題。所以我進一步懷疑是此方法安裝的驅動與礦卡不兼容

第二次嘗試#

我卸載了原先安裝的驅動,到英偉達官網下載了 GTX1080 的.run版本驅動。這個版本的驅動安裝過程比較麻煩,需要屏蔽Nouveau這一開源顯卡驅動並且關閉圖形界面,否則會出現開機黑屏的現象。但是這個驅動也沒有用,仍然顯示No devices were found

第三次嘗試#

我選擇直接安裝 Cuda,然後在安裝 Cuda 時勾選自動安裝顯卡驅動的選項。這樣做的好處是 Cuda 和驅動一起安裝省時省力,同時不需要自己屏蔽開源驅動和關閉圖形界面,簡化了安裝流程。然而這個方法還是沒湊效😴

第四次嘗試#

我嘗試了 Manjaro 和 Windows 系統的多種方法安裝驅動,同樣會有各種報錯

分析問題#

我並沒有第一時間懷疑顯卡出了問題,因為海鮮市場奸商在發貨前承諾卡進行了壓力測試。

我在英偉達的社區上提問尋找解決方法,但是並沒有人回應我

e0j9s

我翻遍英偉達社區相似問題的回答,嘗試了其中給出的方法都沒有解決我的問題,於是我仔細研讀驅動安裝日誌,發現其中有RmInitAdapter failed!這樣一行,在反復對比網上的相似問題後,我意識到可能是顯卡有問題了,於是在某寶上重新下單了一塊顯卡,採用 Cuda 和顯卡驅動捆綁安裝的方式,一下子就好了!

xyhkl

終於出現了美妙的nvidia-smi輸出

9xk8g

總結#

至此,這張顯卡已經可以正常使用了。我想說,在海鮮市場明顯是販子的人手中賣硬件不能盲目相信他所謂的已經進行過測試,在發現問題時應該多懷疑硬件的問題😅,不要把寶貴的時間花在排查其他問題,結果最後發現是硬件壞了。同時,在測試完好之前不要拆開顯卡,我一拿到手拆開檢查了一下顯卡矽脂狀態,破壞了保修貼紙,在發現這張顯卡是壞的時候就沒法退貨了,只能當壞卡賣了

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。