イントロダクション#
グラフィックスカードのドライバをインストールするのは実際には非常に簡単です
この記事では、1 か月以上かかるイライラするグラフィックスカードのドライバインストールプロセス(最終的にはグラフィックスカードが壊れていることがわかりました)と、このプロセスでの気づきを記録しています。
背景#
前回の続きですが、1500 元でコンピュータを購入した後、深層学習の導論の授業でサーバーを使用できるようにするために、計算カードが必要でした。そのため、魚市場で P104-100 を注文し、悪夢のようなグラフィックスカードドライバのインストールの旅が始まりました。
ドライバのインストールプロセス#
最初の試み#
グラフィックスカードを手に入れた直後に、PPA を使用してドライバをインストールしようとしました。まず、apt
リポジトリを追加します。
sudo add-apt-repository ppa:micahflee/ppa
sudo apt update
次に、ubuntu-drivers
コマンドを使用して推奨されるドライバをインストールします。
❯ ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.1/0000:10:00.0 ==
modalias : pci:v000010DEd00001B87sv000010DEsd00001237bc03sc02i00
vendor : NVIDIA Corporation
model : GP104 [P104-100]
driver : nvidia-driver-470-server - distro non-free
driver : nvidia-driver-390 - distro non-free
driver : nvidia-driver-545 - third-party non-free
driver : nvidia-driver-525 - distro non-free
driver : nvidia-driver-535-server - distro non-free
driver : nvidia-driver-470 - distro non-free
driver : nvidia-driver-525-server - distro non-free
driver : nvidia-driver-450-server - distro non-free
driver : nvidia-driver-535 - distro non-free recommended
driver : nvidia-driver-418-server - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
推奨されるドライバはnvidia-driver-535
ですので、直接インストールします。
sudo apt install nvidia-driver-455
sudo reboot
または、次のコマンドを使用しても同じ効果が得られます。
sudo ubuntu-drivers autoinstall
これでグラフィックスカードのドライバのインストールプロセスは終了するはずです。これでこのグラフィックスカードを正常に使用できるはずです(実際、グラフィックスカードが正常であれば)。しかし、Nvidia-smi
を実行した後にエラーが発生しました。
❯ nvidia-smi
No devices were found
検索を行った後、マザーボードの問題かもしれないとわかりましたので、マザーボードをチェックし、CPU の内蔵グラフィックスをデフォルトのグラフィックスカードに設定し、Above 4G Decoding
オプションが有効になっていることを確認しましたが、問題は解決しませんでした。そのため、この方法でインストールされたドライバとマイニングカードが互換性がない可能性があると疑っています。
2 回目の試み#
以前にインストールしたドライバをアンインストールし、NVIDIA の公式ウェブサイトから GTX1080 の.run
バージョンのドライバをダウンロードしました。このバージョンのドライバのインストールプロセスは少し複雑で、オープンソースのグラフィックスカードドライバであるNouveau
を無効にし、グラフィカルなインターフェースを閉じないと、起動時にブラックスクリーンが表示されることがあります。しかし、このドライバも機能せず、引き続き「デバイスが見つかりません」と表示されます。
3 回目の試み#
Cuda を直接インストールし、Cuda のインストール時に自動的にグラフィックスカードのドライバをインストールするオプションを選択しました。これにより、Cuda とドライバを同時にインストールすることで時間と手間を省くことができ、オープンソースのドライバを無効にしたりグラフィカルなインターフェースを閉じる必要がなくなり、インストールプロセスが簡略化されました。しかし、この方法でもうまくいきませんでした😴
4 回目の試み#
マンジャロと Windows システムでさまざまな方法を試しましたが、さまざまなエラーが発生します
問題の分析#
最初はグラフィックスカードに問題があるとは思いませんでした。なぜなら、魚市場の詐欺師は出荷前にカードをテストしたと約束していました。
NVIDIA のコミュニティで質問して解決策を探しましたが、誰も私に返信しませんでした。
似たような問題に対する NVIDIA コミュニティの回答を探しましたが、提供された方法を試しても問題が解決しませんでした。そのため、ドライバのインストールログを注意深く研究し、RmInitAdapter failed!
という行があることに気づきました。インターネット上の類似の問題と繰り返し比較した後、グラフィックスカードに問題がある可能性に気づきました。そのため、再度オンラインで注文し、Cuda とグラフィックスカードドライバをバンドルしてインストールする方法を使用しました。すると一気に解決しました!
ついに素晴らしいnvidia-smi
の出力が表示されました
まとめ#
これで、このグラフィックスカードは正常に使用できるようになりました。私は言いたいことがあります。魚市場で明らかに詐欺師の手にあるハードウェアを購入する際には、彼らがテストを行ったという彼らの主張を盲目的に信じるべきではありません。問題が発生した場合は、ハードウェアの問題を疑うべきです😅。貴重な時間を他の問題のトラブルシューティングに費やさずに、最終的にはハードウェアが壊れていることがわかりました。同時に、テストが完了するまでグラフィックスカードを開封しないでください。私は手に入れた直後にグラフィックスカードのシリコンパッドの状態をチェックし、保証シールを破損しました。このグラフィックスカードが壊れていることがわかったため、返品することはできず、壊れたカードとして販売するしかありませんでした。