如何從零開始搭建深度學習工作站
文章導讀:
隨著AlphaGo橫(heng)空(kong)出(chu)世(shi)擊(ji)敗(bai)韓(han)國(guo)頂(ding)尖(jian)圍(wei)棋(qi)高(gao)手(shou)李(li)世(shi)石(shi),人(ren)工(gong)智(zhi)能(neng)第(di)一(yi)次(ci)真(zhen)正(zheng)進(jin)行(xing)大(da)眾(zhong)視(shi)野(ye),並(bing)在(zai)近(jin)幾(ji)年(nian)出(chu)現(xian)星(xing)火(huo)燎(liao)原(yuan)之(zhi)勢(shi),而(er)深(shen)度(du)學(xue)習(xi)作(zuo)為(wei)人(ren)工(gong)智(zhi)能(neng)一(yi)個(ge)最(zui)重(zhong)要(yao)的(de)分(fen)支(zhi),也(ye)開(kai)始(shi)在(zai)各(ge)行(xing)各(ge)業(ye)應(ying)用(yong)起(qi)來(lai)。深度學習的興起離不開對海量數據的依賴,而處理海量數據,對機算機的性能有很高要求。工欲善其事必先利其器,本文就來詳細談談如何搭建一台滿足日常需要的工作站。
正文:
zuijinyouyugongzuodexuyao,zujianleyitaishiyongyushenduxuexidegongzuozhan。gongzuotaidedajianshejidaoyingjianjiruanjianliangbufen,meiyibufendouduizhengtixingnengyouyingxiang,erqiehaixuyaozonghekaolvshijiyanfaxuyaohehouqidekuozhanxing。xiamianjiulaixiangxishuoshuomeiyidian,xiwangduidajiayoubangzhu。
硬件選購考慮因素:
一、顯卡GPU
顯卡作為整體最優先考慮的硬件,直接決定了整體的預算及性能。如果要擴展4卡,對主板和CPU的選購會有特殊的要求,整體的價格也會貴至少2倍以上。對於一般使用場景,建議單卡入門,最多支持擴展到2卡就行了。
從上圖可以明顯看出,GPU上的投資回報比基本呈線性變化,因此可以按照自己的需要量力而行。不過除非是在過去型號的GPU上已有投資,否則強烈建議直接上GTX 1080Ti。
二、中央處理器CPU
深度學習主要占用GPU資源,對CPU要求不是很高,再加上隻考慮最多擴展雙顯卡,所以消費級的CPU完全能滿足需要,不用考慮企業級或雙CPU方案。上一代或最新一代的I7 超頻版CPU是個不錯的選擇,核心多,頻率高。
三、主板
主板作為整個係統的地基,需要有個全局性的考慮,雖然不像CPU和顯卡一般有明顯的性能差異,但決定了整個主機的硬件層次及後期的升級。建議直接購買一線品牌,質量、做工及穩定性方麵都有保障。再加上隻考慮支持雙顯卡交火,目前市麵上大多數的係列都兼容。
四、存儲
內存方麵首選金士頓,占了市場60%以上的份額,口碑和質量都有保持。建議組多通道及選DDR4 2400以上的頻率。
由於深度學習隻需要在運行處理大量數據,平時存儲時對速度要求並不高。可以采取普通的機械硬盤(HDD)和固態硬盤(SSD)相結合的方式,兼顧速度和存儲要求。機械硬盤從西數和希捷中挑一個就行,建議2T以yi上shang容rong量liang,容rong量liang越yue大da,性xing價jia比bi越yue高gao,相xiang比bi其qi它ta硬ying件jian,完wan全quan是shi白bai菜cai價jia了le。固gu態tai硬ying盤pan速su度du比bi機ji械xie硬ying盤pan快kuai了le幾ji倍bei,對dui係xi統tong整zheng體ti性xing能neng有you很hen大da提ti升sheng,缺que點dian就jiu是shi一yi個ge字zi:貴。所以容量方麵建議至少要256G,有經濟實力的就直接512G吧,一步到位。固態硬盤還有個要考慮的因素是接口規格了,目前主流的有SATA3和M.2兩種。M.2速度快,但有些主板識別不到,導致在安裝操作係統(Ubuntu)時無法安裝在固態硬盤上。
五、電源及機箱
電dian源yuan作zuo為wei整zheng機ji的de動dong力li輸shu出chu,首shou要yao考kao慮lv的de因yin素su是shi能neng夠gou提ti供gong穩wen定ding並bing且qie夠gou用yong的de功gong率lv輸shu出chu,用yong料liao及ji做zuo工gong也ye是shi必bi須xu要yao考kao慮lv的de因yin素su。電dian源yuan行xing業ye品pin牌pai多duo如ru牛niu毛mao,而er且qie代dai工gong貼tie牌pai占zhan據ju絕jue大da多duo數shu比bi例li,在zai這zhe種zhong情qing況kuang下xia優you化hua選xuan擇ze一yi線xian品pin牌pai:海盜船,長城,安鈦克、台達。其次要考慮的購買多大的瓦數,保險起見,我建議購買850W以上的(之後如果擴展多一張顯卡也完全夠用)。
機箱就沒什麼硬性要求了,隻要內部空間足夠就行了。優先考慮全塔式,可以根據自已的喜好進行選購。
工作站組裝及係統安裝:
計(ji)算(suan)機(ji)組(zu)裝(zhuang)應(ying)該(gai)是(shi)整(zheng)個(ge)搭(da)建(jian)過(guo)程(cheng)中(zhong)最(zui)簡(jian)單(dan)的(de)部(bu)分(fen)了(le),隻(zhi)要(yao)注(zhu)意(yi)安(an)裝(zhuang)的(de)順(shun)序(xu)及(ji)主(zhu)板(ban)連(lian)線(xian),大(da)都(dou)能(neng)順(shun)利(li)安(an)裝(zhuang)成(cheng)果(guo),並(bing)且(qie)現(xian)在(zai)大(da)多(duo)硬(ying)件(jian)都(dou)做(zuo)了(le)防(fang)呆(dai)設(she)計(ji),不(bu)可(ke)能(neng)會(hui)出(chu)現(xian)插(cha)反(fan)的(de)情(qing)況(kuang)。
第一步將CPU(注意方向)、內存安裝到主板上,將主板附送的主機後置麵板安裝到機箱上。
第二步將散熱安裝到CPU上,放到機箱中,確定散熱器風道方向與散熱器的位置,以免放不下。
第三步塗矽脂,重新將確定好位置的風扇安裝到CPU上。
第四部將主板固定到機箱上,注意機箱上的銅柱不多也不少,避免主板下麵有空餘的銅柱而導致主板短路。
第五步將GPU和其他pcie接口設備安裝到主板與機箱上。
第六步安裝SSD和機械硬盤。
第七步安裝電源模塊。
第八步連接主板及各硬件的線,整理好背線。
第九步開機測試能否進入BIOS界麵。
第十步安裝操作係統Ubuntu LTS 16.04(相對簡單,不展開)。
環境搭建及開源框架選擇:
硬件組裝完畢,安裝好操作係統後,接起來就是深度學習軟件環境搭建部份了。其中就涉及到顯卡驅動和CUDA、CUDNN的安裝,這三塊是基礎,建議直接登陸Nvidia官網跟著官方文檔一步步安裝。
一、顯卡驅動安裝
活進入係統桌麵後,會發現默認的分辨率隻有1024x768,因為係統默認使用了開源顯卡驅動,需要手動更新成N卡最新驅動。
第一步:打開設置,進入軟件更新設置(Software&Updates)。
第二步:選擇附加驅動,等待刷新。
第三步:選擇所列出來的可以析的選項,選擇應用改變即可
第四步:在終端中輸入nvvidia-smi,可以查詢顯卡驅動狀態。

二、CUDA與CUDNN安裝
登陸官網下載CUDAanzhuangbao,zaixiazaishizhaoxiangyingdeguanfanganzhuangwendangzaixiyuedu,jinkenenganzhaotadebuzhouyibubuzou。tongshizaizhaojipianhaodebokewenzhangzuoweicankao,duichangjiandewentiyaozhidaoruhejiejue,zuodaoxiongyouchengzhu。
第一步:檢查自己的電腦環境是否具備安裝CUDA的條件。
第二步:驗證自己的Linux版本是否支持CUDA。
第三步:驗證係統是否安裝了GCC。
第四步:通過package manager安裝。
第五步:重啟電腦,檢查是否安裝成功。
第六步:嚐試編譯CUDA提供的samples。
第七步:根據官網教程安裝CUDNN。
三、Docker安裝
深(shen)度(du)學(xue)習(xi)涉(she)及(ji)到(dao)各(ge)個(ge)領(ling)域(yu)的(de)研(yan)究(jiu),相(xiang)關(guan)的(de)框(kuang)架(jia)不(bu)斷(duan)更(geng)新(xin)和(he)迭(die)代(dai)。如(ru)果(guo)在(zai)同(tong)一(yi)部(bu)主(zhu)機(ji)上(shang)安(an)裝(zhuang)全(quan)部(bu)的(de)框(kuang)架(jia),有(you)可(ke)能(neng)會(hui)出(chu)現(xian)管(guan)理(li)問(wen)題(ti)及(ji)各(ge)種(zhong)包(bao)衝(chong)突(tu)問(wen)題(ti),也(ye)不(bu)利(li)於(yu)工(gong)作(zuo)站(zhan)資(zi)源(yuan)的(de)充(chong)分(fen)利(li)用(yong)。而(er)Docker是一個開源的應用容器引擎,可以方便地打包應用以及依賴包到一個輕量級、可移植的容器中。使用Docker,可以按自己研究的需要,配置不同的Docker鏡像。Docker的安裝相對簡單,這裏就不展開詳細說明,網上也有許多現成的文章可供參考,建議大家登陸官網查找相應的安裝文檔即可成功安裝。
四、深度學習鏡像選擇、
在實際的研究和開發中,可以根據需求下載不同的鏡像。下麵列出常用的鏡像名稱和用途
五、成果演示
最後,讓我們來看看經過以上各個環節後,如何為深度學習研究提供簡單易用的開發環境:
打開終端,連到服務器,運行以下命令啟動容器(根據實際情況,參數不同):
打開瀏覽器,訪問以下地址,能夠正常顯示,一切正常。
總結:
jingguojintiandejiandanshuli,dajiayinggaiduiruhedajianshenduxuexigongzuozhanyoulechubudelejie,zhongyaodeshiduoshijian,sikaozijishijigongzuozhongdexuqiu,dajianchumanzuyanjiudegongzuozhan。yongyouyitaixingnengqiangjindegongzuozhan,cainengrangnizaishenduxuexidehaiyangliruyudeshui,yudaorenhedebotaohailangdounengtairanmiandui。
相關新聞
廣州大麥幹貨郵箱訂閱服務
免費為您提供各類型高質量電商幹貨,方便您隨時閱讀感興趣的幹貨!
輸入店鋪信息,獲取專業全方麵分析
* 您的信息將被嚴格保密,請放心填寫