人工智能爆發原因探討
下麵,就讓我們追溯過去,簡單探討一下人工智能爆發所需要的種種環境和條件。任何一項技術的普及,被千家萬戶所熟知、接(jie)觸(chu)乃(nai)至(zhi)使(shi)用(yong),都(dou)離(li)不(bu)開(kai)其(qi)廉(lian)價(jia)生(sheng)產(chan)成(cheng)本(ben)和(he)使(shi)用(yong)成(cheng)本(ben),而(er)不(bu)僅(jin)僅(jin)在(zai)於(yu)這(zhe)項(xiang)技(ji)術(shu)取(qu)得(de)了(le)多(duo)麼(me)輝(hui)煌(huang)的(de)成(cheng)果(guo)。下(xia)麵(mian)將(jiang)會(hui)從(cong)這(zhe)一(yi)角(jiao)度(du)出(chu)發(fa),進(jin)行(xing)相(xiang)關(guan)的(de)探(tan)討(tao)。
一、深度學習技術的發展奠定理論基礎
時間回溯到10年前,2006年,加拿大多倫多大學教授、機器學習領域泰鬥、神經網絡之父——Geoffrey Hinton 和他的學生Ruslan Salakhutdinov 在頂尖學術刊物《科學》上發表了一篇文章,該文章提出了深層網絡訓練中梯度消失問題的解決方案:無監督預訓練對權值進行初始化+有監督訓練微調。從此,深度學習成為了眾多人工智能領域中最有潛力的一部分,斯坦福大學、紐約大學、加(jia)拿(na)大(da)蒙(meng)特(te)利(li)爾(er)大(da)學(xue)等(deng)成(cheng)為(wei)研(yan)究(jiu)深(shen)度(du)學(xue)習(xi)的(de)重(zhong)鎮(zhen),至(zhi)此(ci)開(kai)啟(qi)了(le)深(shen)度(du)學(xue)習(xi)在(zai)學(xue)術(shu)界(jie)和(he)工(gong)業(ye)界(jie)的(de)浪(lang)潮(chao),人(ren)工(gong)智(zhi)能(neng)也(ye)迎(ying)來(lai)了(le)其(qi)最(zui)近(jin)的(de)一(yi)次(ci)爆(bao)發(fa)期(qi)。而(er)2006年,也被稱為深度學習元年。
在人工智能的發展史上,AlphaGo大戰李世石並非人工智能在智力比賽中戰勝人類的首例,但卻是證明了人工智能能夠達到如同人類大腦一般思考的重要事件。早在1997年,IBM的人工智能Deep Blue就在國際象棋上戰勝過世界冠軍Garry Kasparov,但這並不能證明人工智能的潛力,因為當時的Deep Blue是使用窮舉的方法來達到國際象棋的最優解的,與人類的經驗和直覺相差甚遠。而Hinton所解決的深度學習這一技術的難題,正是人工智能真正向人類智能靠近的重要一步,AlphaGo也正是仰賴於深度學習技術才能夠在圍棋大戰上大放異彩。

隨著時間的推移,基於深度學習的研究成果不斷湧現,在圖像識別、文本處理和語音識別上取得大量足以商業化應用的技術進步。
2011年,ReLU激活函數被提出,該激活函數能夠有效的抑製梯度消失問題。2011年以來,微軟首次將DL應用在語音識別上,取得了重大突破。微軟研究院和Google的語音識別研究人員先後采用DNN技術降低語音識別錯誤率20%~30%,是語音識別領域十多年來最大的突破性進展。2012年,DNN技術在圖像識別領域取得驚人的效果,在ImageNet評測上將錯誤率從26%降低到15%。在這一年,DNN還被應用於製藥公司的DrugeActivity預測問題,並獲得世界最好成績。
2012年,Hinton課題組為了證明深度學習的潛力,首次參加ImageNet圖像識別比賽,其通過構建的CNN網絡AlexNet一舉奪得冠軍,且碾壓第二名(SVM方法)的分類性能。也正是由於該比賽,CNN吸引到了眾多研究者的注意。

2014年,Facebook基於深度學習技術的DeepFace項目,在人臉識別方麵的準確率已經能達到97%以上,跟人類識別的準確率幾乎沒有差別。這樣的結果也再一次證明了深度學習算法在圖像識別方麵的一騎絕塵。
但dan是shi,技ji術shu想xiang要yao走zou進jin千qian家jia萬wan戶hu,光guang有you理li論lun成cheng果guo還hai是shi不bu足zu的de,不bu但dan要yao理li論lun成cheng為wei現xian實shi,而er且qie還hai需xu要yao理li論lun能neng夠gou低di成cheng本ben的de成cheng為wei現xian實shi。下xia麵mian幾ji點dian會hui從cong這zhe個ge角jiao度du出chu發fa進jin行xing探tan討tao。
二、互聯網時代的成熟使采集大量數據的成本變得廉價
說shuo到dao深shen度du學xue習xi,不bu得de不bu說shuo到dao要yao想xiang在zai深shen度du學xue習xi方fang麵mian取qu得de成cheng果guo,必bi須xu先xian要yao有you大da量liang數shu據ju作zuo為wei先xian驗yan知zhi識shi的de支zhi撐cheng。目mu前qian來lai說shuo,深shen度du學xue習xi應ying用yong最zui廣guang泛fan的de方fang麵mian,說shuo白bai了le就jiu是shi從cong大da量liang已yi經jing有you標biao注zhu的de數shu據ju中zhong獲huo得de像xiang人ren類lei經jing驗yan一yi般ban的de知zhi識shi,然ran後hou再zai將jiang這zhe些xie知zhi識shi應ying用yong到dao新xin的de同tong類lei數shu據ju之zhi中zhong。人ren工gong智zhi能neng還hai無wu法fa做zuo到dao完wan全quan像xiang人ren類lei一yi樣yang隻zhi需xu要yao通tong過guo教jiao育yu和he自zi學xue就jiu能neng夠gou獲huo得de知zhi識shi,因yin此ci能neng夠gou被bei用yong戶hu所suo使shi用yong的de人ren工gong智zhi能neng成cheng果guo在zai產chan生sheng之zhi前qian,技ji術shu研yan究jiu人ren員yuan必bi須xu首shou先xian采cai集ji大da量liang的de用yong戶hu數shu據ju。而er互hu聯lian網wang時shi代dai的de到dao來lai,使shi得de用yong戶hu數shu據ju的de采cai集ji變bian得de越yue來lai越yue廉lian價jia。
2000 年,Jimmy Wales 和Larry Sanger 共同成立Wikipedia,這是全球首個開源、在線、協作而成的百科全書,完全不同於《大英百科全書》的編撰方式。Wiki 的用戶在第一年就貢獻了20000 個在線詞條。
2002 年,Friendster 上線,這是首家用戶規模達到100 萬的社交網絡。Friendster 開創了通過個人主頁進行交友的先河。
2003 年,麵向青少年和青年群體的MySpace 上線,它再一次刷新了社交網絡的成長速度:一個月注冊量突破100 萬。
2004 年,Facebook 成立,根據Facebook上市後的首份財報,Facebook 每月有9.55 億用戶活躍用戶(MAU),每月移動平台活躍用戶數有5.43 億。
2004 年同年創立的還有flickr,現在它依然是非常活躍的圖片社區。2005 年,YouTube 成立。2006年,Twitter 成立。兩者的用戶量和數據量當然不用懷疑了。2006年成立的還有Spotify,它現在是社交音樂分享型應用的典型,擁有1500 萬MAU 和400 萬付費用戶。2007 年,輕博客平台Tumblr 成立,目前該平台上有7700 萬個博客;根據2011 年7 月的數據,該網站每月的獨立訪問量是1340 萬。
社she交jiao網wang絡luo的de發fa展zhan使shi人ren們men逐zhu漸jian把ba自zi身shen的de社she交jiao信xin息xi同tong時shi彙hui聚ju到dao幾ji個ge大da的de社she交jiao平ping台tai上shang,而er電dian商shang的de發fa展zhan使shi全quan球qiu的de買mai家jia和he賣mai家jia聚ju集ji到dao幾ji個ge巨ju型xing網wang絡luo購gou物wu平ping台tai上shang,提ti供gong大da量liang購gou物wu偏pian好hao和he購gou買mai習xi慣guan的de信xin息xi以yi及ji商shang品pin的de信xin息xi。擁yong有you這zhe些xie平ping台tai的de大da公gong司si可ke以yi輕qing易yi獲huo取qu到daoPB級別的巨量數據,作為訓練數據放入機器學習算法中去,從而獲得相關的人工智能成果。
雖sui然ran這zhe些xie大da公gong司si曾zeng發fa生sheng未wei經jing用yong戶hu許xu可ke擅shan自zi使shi用yong用yong戶hu數shu據ju從cong而er侵qin犯fan用yong戶hu隱yin私si權quan的de事shi件jian,因yin此ci引yin發fa社she交jiao網wang絡luo的de信xin任ren危wei機ji。但dan是shi隱yin私si方fang麵mian的de問wen題ti並bing非fei本ben文wen討tao論lun的de重zhong點dian,因yin此ci略lve過guo。
三、存儲巨量數據的成本降低,深度學習成本進一步下降
獲得數據的成本降低了,但是巨量的數據同時意味著龐大的存儲需求。而慶幸的是,在深度學習教父hinton解決深度學習難題的前後,大規模數據存儲設備出現了,並且,存儲的成本也經曆了快速的下降,對TB級ji別bie數shu據ju的de存cun儲chu設she備bei也ye可ke以yi被bei普pu通tong消xiao費fei者zhe所suo購gou買mai到dao,存cun儲chu設she備bei的de讀du寫xie速su度du和he帶dai寬kuan也ye飛fei速su增zeng大da。這zhe意yi味wei著zhe,任ren何he人ren都dou可ke以yi把ba從cong互hu聯lian網wang上shang或huo者zhe其qi他ta途tu徑jing獲huo得de的de大da量liang數shu據ju存cun儲chu起qi來lai,用yong作zuo機ji器qi學xue習xi訓xun練lian或huo者zhe其qi他ta用yong途tu。
2003年1月,日立宣布完成20.5億美元的收購IBM硬盤事業部計劃,並成立日立環球存儲科技公司(Hitachi Global Storage Technologies, Hitachi GST)。
2005年日立環儲和希捷都宣布了將開始大量采用磁盤垂直寫入技術(perpendicular recording),該原理是將平行於盤片的磁場方向改變為垂直(90度),更充分地利用的存儲空間。
2007年1月,日立環球存儲科技宣布將會發售全球首隻1TB的硬盤。硬盤的售價為399美元,平均每美分可以購得27.5MB硬盤空間。
2018年的今天,1TB的大容量硬盤已經普及到每一台PC機上,人們隨身攜帶的手機上都有著上百GB的存儲容量。最流行的用作機器學習訓練的數據集imagenet包含約120萬張訓練圖像、5萬張驗證圖像和10萬張測試圖像,分為1000個不同的類別,達到140GB以上,但是現在的人們不僅可以把這些數據直接放在家裏的PC上,甚至可以用移動硬盤帶在身上到處走。

時至2016年alpha go橫空出世的時候,存儲的世界不再是傳統機械硬盤hdd的時代,而逐漸顯示出讀寫速度更快的固態硬盤ssd將會替代hdd的趨勢,容量更大、質量更高的存儲的價格也持續的變得更加的便宜。
四、摩爾定律持續了半個世紀,gpu計算框架橫空出世,計算能力變得越來越廉價
摩爾定律是由英特爾(Intel)創始人之一戈登·摩爾(Gordon Moore)提出來的。其內容為:當價格不變時,集成電路上可容納的元器件的數目,約每隔18-24個月便會增加一倍,性能也將提升一倍。換言之,每一美元所能買到的電腦性能,將每隔18-24個ge月yue翻fan一yi倍bei以yi上shang。這zhe一yi定ding律lv從cong被bei提ti出chu的de一yi刻ke開kai始shi,預yu言yan了le未wei來lai半ban個ge世shi紀ji信xin息xi技ji術shu進jin步bu的de速su度du,同tong時shi也ye顯xian示shi出chu計ji算suan能neng力li在zai半ban個ge世shi紀ji內nei在zai同tong一yi價jia格ge水shui平ping上shang經jing曆li了le34次的翻倍提升。
而在2010年之後,cpu算力增長出現明顯的放緩,但GPU類處理器內部的晶體管數量還保持著快速增長的勢頭,大有從cpu手中接過摩爾定律大旗的態勢。

人工智能研究人員進行每一次的深度學習研究過程中的算法訓練,都離不開大規模計算能力的支撐。而在cpu經曆了半個世紀的進化迭代之後,在支持深度學習的訓練方麵仍然稱不上足夠廉價。而在NVIDIA於2008年開始打造CUDA架構之後,GPU的用途已經發生了翻天覆地的變化。長久以來受限於CPU處理能力的人工智能也在那個時刻找到了更加適合的源動力,並且憑借GPU的性能不斷提升,極大的拓展了人工智能的能力和適用範圍。
按照傳統方案,雲服務商可以采購4個機架、共160個CPU服務器,在功耗65千瓦的情況下提供每秒45000張照片的處理能力。而如果換成NVIDIA的產品,隻需要一個裝有8片V100 GPU的NVIDIA HGX服務器,同樣的每秒45000張照片處理能力,但是你隻需要7個服務器插槽,總共的功耗也隻有3個千瓦。
明ming顯xian的de數shu字zi對dui比bi,背bei後hou是shi對dui於yu企qi業ye來lai說shuo的de巨ju大da的de采cai購gou和he運yun營ying成cheng本ben差cha距ju。而er對dui於yu個ge人ren來lai說shuo,在zai學xue習xi深shen度du學xue習xi時shi進jin行xing算suan法fa訓xun練lian所suo需xu要yao的de龐pang大da計ji算suan能neng力li,也ye由you於yuGPU對深度學習的友好支持變得觸手可及。大型3D遊戲行業的發展使得台式遊戲機的價格變得普通家庭都可以承受,而每台台式遊戲機的配置中隻要包含CUDA 計算能力為3.0 或更高的GPU ka,jiukeyidajianzhichishenduxuexidejisuanhuanjing。shenduxuexiherengongzhinengderumenchengbenbiandewubidilian,rangwushurencaikeyitongguopeixunjigoushenzhizixuejinrurengongzhinengzhegezhengzaifeisufazhandexingye,wushuderengongzhinengchuangyexiangmuyedeyijiyuxiaoedechuangtouzijinqidongqilai,jinyibucujinrengongzhinengxingyedefanrong,congerxiyingengduodetouzijinruzhegexingye,xingchengyigeliangxingdexunhuan。
總結:
這zhe一yi切qie都dou使shi人ren工gong智zhi能neng的de推tui廣guang變bian得de沒mei有you那na麼me困kun難nan,人ren工gong智zhi能neng的de研yan究jiu再zai也ye不bu是shi特te定ding大da公gong司si或huo者zhe政zheng府fu讚zan助zhu機ji構gou的de專zhuan利li。任ren何he一yi個ge行xing業ye的de繁fan榮rong都dou不bu可ke能neng隻zhi由you一yi兩liang家jia大da公gong司si營ying造zao出chu來lai,而er需xu要yao由you數shu量liang眾zhong多duo的de大da小xiao公gong司si、無wu數shu的de人ren才cai和he創chuang意yi以yi及ji大da額e的de投tou資zi共gong同tong去qu促cu進jin整zheng個ge行xing業ye不bu斷duan生sheng產chan出chu更geng多duo足zu以yi改gai變bian人ren類lei生sheng活huo的de發fa明ming和he發fa現xian。目mu前qian的de人ren工gong智zhi能neng行xing業ye已yi經jing具ju備bei了le持chi續xu爆bao發fa性xing發fa展zhan的de環huan境jing和he條tiao件jian,也ye正zheng處chu於yu持chi續xu上shang升sheng期qi中zhong。有you理li由you去qu相xiang信xin,這zhe次ci的de人ren工gong智zhi能neng爆bao發fa和he之zhi前qian的de新xin能neng源yuan、VR以及智能硬件不同,能夠最終成長到可以改變普通人的生活的方方麵麵,邁出人類工業革命性的一步。
文章參考:
ü 百度百科:圖形處理器
ü 依圖科技:當摩爾定律麵臨失效,我們或許可以建立一個行星級的智能係統
ü 徐鑫:兩年股價漲十倍,英偉達用芯片綁架了整個人工智能圈子
ü 百度百科:戈登摩爾
ü 李賡:黃仁勳:GPU才是AI時代的摩爾定律
ü 機器之心: CVPR 2017 李飛飛總結8 年ImageNet 曆史,宣布挑戰賽最終歸於Kaggle
ü 快科技:數據解讀2011-2016年全球SSD發展史
ü 天空蔚藍:硬盤15年發展滄桑:容量成長遠勝於性能的建樹
ü 百度百科:社交網絡
輸入店鋪信息,獲取專業全方麵分析
* 您的信息將被嚴格保密,請放心填寫