【文末開獎】如何配置一台以機器學習、深度學習為用途的工作站?

來源:https://www.zhihu.com/question/310387269 轉自:深度學習與電腦視覺 聲明:僅做學術分享,侵刪

作者:丁一帆 https://www.zhihu.com/question/310387269/answer/926638382

這裡介紹10K以下的機器

眾所周知,深度學習是有錢人的遊戲(笑)作為一個窮學生(definitely)為了不只和minist較勁,需要配置一台較好的工作站,然而學生荷包空空,實驗室的伺服器搶手,如何配置一台夠用的伺服器呢。

(洋垃圾)伺服器篇:

窮人的救星,P104顯示卡

P104顯示卡,或者說是換了馬甲的1070顯示卡,擁有8G顯示記憶體,一般只要700RMB就能搞到不錯的橙色,用於跑深度學習再好不過了

筆者剛好有一塊P104顯示卡。這塊卡是750rmb收的。用於跑深度學習再好不過了

大概長這樣

卡支援cuda,意味著tensorflow和pytorch都可以使用

tensorflow初始化,8G顯示記憶體可用

由於去掉了影片輸入輸出模組,該卡的溫度較低,滿載65攝氏度左右。

手上剛好有個PSMNet 跑一下看看溫度吧

第二個epoch,其實大差不差

然後是算力?算力的話,以1080ti為坐標系1 大概是0.6-0.7左右(訓練PSMnet的時候有圖片載入時間,是0.7)

如果電源夠大,可以考慮四塊連載,效果更佳

(洋垃圾)平台篇(c612)

如果是老師付電費系列,當然可以直接選擇C612

現在x99平台的cpu已經足夠便宜(AMD,YES!)這裡推薦使用富士康的主板和e5 2670v3*2

加起來也就1700元

擁有48條PCIE和28C 56T 足夠你插4塊顯示卡了

當然作為A fan 我肯定用amd啦

大玩具2

主力機

但是一定要知道,amd的pcie實際上是不足的,最多支援兩塊顯示卡,拿來跑小項目還行,多卡大項目是不行的

(洋垃圾)散熱篇

水冷?不存在的。買不起。

基本上是靠暴力風扇來散熱,做深度學習多卡一定要先考慮散熱再上玩具,大部分機箱的散熱性能堪憂,兩塊顯示卡就能上90度,千萬別嫌吵,能上多大風扇上多大風扇。

基本上就寫道這裡把,我會一點cuda,主語言還是C++,人生苦短,python太慢,還是C++好。

作者:sqrt3 https://www.zhihu.com/question/310387269/answer/589429977

我覺得可以分情況討論

1.新手:沒有任何深度學習經驗,想體驗一下深度學習技術(跑一些現成的程式碼)

選擇A – 各種云:個人只用過AWS雲,其它的估計差不多。好處在於可以直接載入別人的預設環境,省去很多配環境的煩惱,並且學生/新手有各種優惠,基本不用花什麼錢。

選擇B – 淘寶租伺服器:目前淘寶租一個月單卡1060伺服器約400元,租一個月1080ti約1100元,還提供各種有償配環境的服務,個人覺得比雲要實在一些。

選擇C – 拿自己已經有的機器:15年以前的模型基本上CPU或者MX150就能跑了,也可以順便學學怎麼配環境裝驅動。

2.入門:已經學習了一些深度學習基礎,打算參與實戰項目,比如復現論文和改進經典的模型。

這個階段不建議大家用雲,性價比不高並且折騰的空間小,畢竟只有在不停折騰中才能不斷進步。

選擇A – 遊戲主機: 按照家用遊戲主機的思路,根據自己的經濟情況選擇相應的配置,可以參考網路上很多現成的推薦,也可以直接對已有主機進行升級(比如多插一塊礦卡,再升級下電源)。

要注意深度學習和遊戲不同的幾點

  • 因為希望機器能長時間高性能運轉,盡量選擇更好的電源/散熱和主板
  • 超頻的本質是用速度換穩定性,所以不要考慮超頻
  • 把大部分的錢花在顯示卡上,可以上雙卡(不需要主板支援SLI,只要有顯示卡插槽就行,兩張顯示卡也不需要型號相同)
  • 差錢的話可以考慮內顯+礦卡,比如i3 8100+雙P106的配置,3000元左右就能配到一台顯示記憶體和算力都說過得去的深度學習主機,基本上17年以前的深度學習模型都能訓練
  • 10系和20系顯示卡的選擇:如果不用FP16的話(入門玩家使用FP16有點自找麻煩),目前10系卡性價比高一些。介意二手就買20系卡,或者等將來20系砍光線追蹤的版本(gtx1180?)

選擇B – 伺服器主機(洋垃圾)/礦機:適合預算有限的情況下追求更高的算力和性價比,是垃圾佬的話自然懂,所以不做展開以免讓大家誤入歧途。但有一點需要告誡垃圾佬:顯示記憶體不是簡單的相加,6張p106雖然顯示記憶體加起來比一張tesla v100還多,但是並不能開一樣大的batch,因為模型的參數是每張卡都要複製一份的。比如你模型有3g,那你每張卡就只剩下3g分給數據了,相當於有效顯示記憶體只有一半,別問我是怎麼知道的。。。

3 進階(科研方向):已經熟練掌握深度學習知識,理論基礎紮實,打算follow最新的文章,探索未知的模型架構

不同研究領域對卡的需求差別很大,聽說很多做理論的數學大佬都不怎麼用顯示卡的。我目前在學習NLP,如果想要合理的時間內fine-tuning一個BERT-base(18年最火的模型),至少要2張1080或者同等算力的專業卡。並且調參調模型一般會同時跑好幾個實驗,所以卡越多,進展就越快,成功的概率就越大。如果是做CV裡面的和影片相關的一些task,就更加吃卡了。這種需求如果不是家裡有礦,還是藉助實驗室或者公司比較實際。實驗室一台主機8張卡,會有幾個人和你一起分,就我在兩個學校的經歷來看大部分時間大部分卡都是空著的,只有接近論文DDL的時候會擠到爆炸。

就算有伺服器的情況下最好還是按照上面的建議自己組一台/申請一台主機,顯示卡的話可以選擇和伺服器盡量接近的版本(比如伺服器是v100本地就配20系,伺服器是titanxp本地就配10系),畢竟本地debug更方便,並且在伺服器爆炸/斷電的時候還有顯示卡用一用。。。

4 進階(工程方向):已經有深度學習項目經驗,實踐能力強,打算開發一些fancy的應用

這一塊我了解的不多,可能在雲上開發應用是更合適的選擇,因為雲上有很多演算法落地的API可以用,比如你要開發一個對話系統,就可以用雲上語音轉文字/文字轉語音等等API來拓展使用場景。

作者:致熵 https://www.zhihu.com/question/310387269/answer/583357364

既然從筆記型電腦轉過來,說明需求也不特別大,可以考慮以下配置:

顯示卡2080ti,如果是上多塊顯示卡,處理比較複雜些,單卡可以風冷,多卡必上水冷。同時多卡對主板cpu的要求大幅提高。

主板+CPU,必須要聯合起來考慮,最主要的是通道數,如果是單卡,就普通桌面高級版即可,具體看CPU是哪家的,有配套。但要注意,如果是多卡,或者先單卡,之後打算升級的,也要配高通道數的板U。至於核心數,如果不考慮其他用途,少一些也沒關係,核心數和錢成正比關係。

散熱器:不超頻可以用風冷,建議水冷穩定些。

記憶體:可以考慮每卡32G,當然和你的內容有關,盡量大些,同時上面的主板也要考慮最大支援記憶體。至於超頻,為了穩定性,不建議CPU和主板記憶體等超頻。

硬碟:建議m2固態1t,想小一點500g必須的,當然如果用兩個,sata大容量SSD加一個也是可以的。至於機械硬碟,反正很便宜,接一個也可以,拆卸也方便。

機箱:一定要大些,品牌好點的。2卡以下全塔中塔都可以,如果用兩個電源必須用全塔。

電源:把所有最大功耗加起來,然後除以70%。比如(以下為假設功耗)單卡250w,CPU170w(注意CPU在睿頻時功率大幅高於標稱的95w),主板記憶體條固體機械鍵盤風扇等算它120w,外接設備預留50w,還有什麼漏了都可加上,然後除以70%,得到850w左右,如果是金牌電源可以除以80%。注意有的顯示卡是超頻的,功率可能是320w。不要卡得很緊。電源要好點的。

顯示器:平面,設計用的,4k 32-40英寸(感覺27吋實在字太小了,而2k又顯示內容不夠多)

鍵盤:機械鍵盤,茶的試試,不怕手累可以青的,但千萬別買紅軸。

最後:具體配置看需求,看預算,看計劃。

作者:幽泉ba主 https://www.zhihu.com/question/310387269/answer/583763336

個人建議,工作站電腦還是不要DIY配置,直接購買專業工作站電腦整機比較好。

由於工作站的特殊性,其需要面對7*24小時滿負荷工作狀態,這種不是一般DIY台機出廠檢查需要標準,因此不能保證DIY台機能夠實現相關工況而不出現任何故障問題;而專業的工作站電腦整機在設計、配置、檢測都是按照相關標準進行的,能夠保證工作穩定性。

其次,就是專業工作站一般會有針對不同應用而開發的配套軟體,這些也是其價值所在;而一般DIY台機是無法獲取或者無法使用的(需要特定硬體支援)。

所以,如果你真的需求一台用於工作的工作站電腦,建議購買專業產品,而非DIY台機。