寒武紀(jì)科技(Cambricon)是中科院計(jì)算所孵化的一家獨(dú)角獸公司,2016年推出的寒武紀(jì)1A處理器(Cambricon-1A)是世界首款商用深度學(xué)習(xí)專用處理器,面向智能手機(jī)、安防監(jiān)控、可穿戴設(shè)備、無人機(jī)和智能駕駛等各類終端設(shè)備。
華為官方在Twitter也發(fā)布了一張海報(bào),上面寫著一句話:“AI不止是語音助手”,預(yù)示華為下一代自研的處理器將擺脫束縛,實(shí)現(xiàn)更多人機(jī)交互的可能性。余承東認(rèn)為:“人工智能時(shí)代的來臨,意味著移動互聯(lián)網(wǎng)進(jìn)入到智慧互聯(lián)網(wǎng)時(shí)代,用戶入口將有由從傳統(tǒng)的APP,向智慧助理+API入口發(fā)展。未來的智能手機(jī)將成為真正的智慧手機(jī),到2025年超過90%的智能終端用戶將從個(gè)性化、智慧化的智能個(gè)人助理服務(wù)中獲益?!?/span>
全球智能芯片領(lǐng)域“搶占賽道”白熱化
而放眼全球,科技巨頭對于智能芯片追逐和布局已經(jīng)到了白熱化的地步:
1. 人工智能顯卡芯片總龍頭英偉達(dá)股價(jià)2年8倍,繼續(xù)領(lǐng)漲美國科技股;
2. 2016年7月20日,軟銀宣布將以243億英鎊(約合320億美元),43%的溢價(jià)收購移動端芯片總龍頭ARM,英國芯片設(shè)計(jì)公司ARM;
3. 2016年9月,英特爾收購視覺芯片公司Movidius;
4. 2017年3月,英特爾宣布以153億美元收購以色列無人駕駛Mobileye;
5.谷歌自主研發(fā)人工智能數(shù)據(jù)中心芯片TPU,搭載AlphaGo應(yīng)用,橫掃人類圍棋界
“芯片”是站在整個(gè)電子產(chǎn)業(yè)鏈最頂端的行業(yè),在英特爾芯片壟斷PC時(shí)代、ARM芯片稱霸移動互聯(lián)網(wǎng)時(shí)代的歷史進(jìn)程中,芯片永遠(yuǎn)都是作為產(chǎn)業(yè)鏈最上游,是行業(yè)先導(dǎo)指標(biāo)。核心芯片決定一個(gè)計(jì)算時(shí)代的基礎(chǔ)架構(gòu)!當(dāng)今谷歌、微軟、IBM、Facebook、英偉達(dá)等IT巨頭之所以紛紛投巨資加速人工智能核心芯片的研發(fā),都是意圖從源頭上掌控核心芯片架構(gòu),取得人工智能計(jì)算時(shí)代的主導(dǎo)權(quán)。未來3-5年,隨著人工智能定制芯片的突破,所有行業(yè)都將實(shí)現(xiàn)人工智能化!屆時(shí),智能化市場之規(guī)模和容量將數(shù)十倍于現(xiàn)今的移動互聯(lián)網(wǎng)市場。
在PC時(shí)代處于霸主地位的X86架構(gòu)和移動互聯(lián)網(wǎng)時(shí)代壟斷全行業(yè)的ARM架構(gòu)的發(fā)展歷程表明,核心芯片決定了一個(gè)新的計(jì)算平臺的基礎(chǔ)架構(gòu)和發(fā)展生態(tài),新的計(jì)算時(shí)代來臨之時(shí)往往是新興企業(yè)彎道超車的絕佳機(jī)遇,目前使用的GPU、FPGA均非人工智能定制芯片,天然存在局限性,人工智能專用芯片對于IT巨頭和初創(chuàng)企業(yè)是同一起跑線的藍(lán)海。
目前以深度學(xué)習(xí)為代表的人工智能新計(jì)算需求,主要采用 GPU、FPGA,AISC定制化芯片等已有適合并行計(jì)算的通用芯片來實(shí)現(xiàn)加速。
三種主流人工智能芯片方向:GPU, FPGA,AISC定制
GPU:以英偉達(dá)為主導(dǎo)的GPU芯片,作為圖像處理器,設(shè)計(jì)初衷是為了應(yīng)對圖像處理中需要大規(guī)模并行計(jì)算。因此,其在應(yīng)用于深度學(xué)習(xí)算法時(shí),存在應(yīng)用過程中無法充分發(fā)揮并行計(jì)算優(yōu)勢,硬件結(jié)構(gòu)固定不具備可編程性,運(yùn)行深度學(xué)習(xí)算法能效遠(yuǎn)低于 FPGA。
FPGA:即現(xiàn)場可編輯門陣列,是一種新型的可編程邏輯器件。其設(shè)計(jì)初衷是為了實(shí)現(xiàn)半定制芯片的功能,即硬件結(jié)構(gòu)可根據(jù)需要實(shí)時(shí)配臵靈活改變。目前的FPGA 市場由 Xilinx 和 Altera主導(dǎo),兩者共同占有 85%的市場份額,其中Altera 在 2015 年被 intel 以 167 億美元收購(此交易為 intel 有史以來涉及金額最大的一次收購案例),另一家Xilinx 則選擇與 IBM 進(jìn)行深度合作,背后都體現(xiàn)了 FPGA 在人工智能時(shí)代的重要地位。
對于機(jī)器學(xué)習(xí)算法的性能和功耗的角度來說:FPGA 可以開發(fā)出為機(jī)器學(xué)習(xí)算法專用的架構(gòu),但是 FPGA 本身的峰值性能較 GPU 要差很多。
FPGA 實(shí)現(xiàn)的機(jī)器學(xué)習(xí)加速器在架構(gòu)上可以根據(jù)特定應(yīng)用優(yōu)化所以比 GPU 有優(yōu)勢,但是 GPU 的運(yùn)行速度(>1GHz) 相比 FPGA 有優(yōu)勢 (~200MHz)。所以,對于平均性能,看的就是 FPGA 加速器架構(gòu)上的優(yōu)勢是否能彌補(bǔ)運(yùn)行速度上的劣勢。
AISC定制:ASIC是指依產(chǎn)品需求不同而定制化的特殊規(guī)格集成電路,由特定使用者要求和特定電子系統(tǒng)的需要而設(shè)計(jì)、制造。以谷歌TPU為代表的AISC定制化芯片(包括4個(gè)芯片能夠提供180TFLOPs浮點(diǎn)運(yùn)算的計(jì)算能力)就是一種最大化性能需求和成本能耗平衡的重要手段。
打個(gè)形象的比方,我們設(shè)計(jì)一款人工智能芯片就像設(shè)計(jì)一個(gè)某種功能的房子,那么我們有三種選擇:
1. 買一個(gè)已有的比較通用的房子,然后改變內(nèi)部的軟件設(shè)施來讓這個(gè)房子達(dá)到我們需要的功能,優(yōu)點(diǎn)是對于用戶代價(jià)小,但肯定沒法達(dá)到性能最大化,這就對應(yīng)了通用型GPU芯片;
2. 買一個(gè)半成品的房子,我們可以隨時(shí)改變房子里面的各個(gè)房間格局,優(yōu)點(diǎn)是相對第一種房子性能肯定會更貼近我們需求,而且也保證了一定靈活性,如果需求有改變,可以隨時(shí)再改變內(nèi)部房間格局,這對應(yīng)了FPGA芯片;
3. 完全一塊磚一塊磚按自己需求重新搭建一個(gè)房子,這種肯定性能上最能貼近我們的需求,但是一次性投入太大,如果不是確定性需求需要冒風(fēng)險(xiǎn),這就對應(yīng)ASIC芯片。
所以我們可以不難理解為什么大部分創(chuàng)業(yè)公司都會采用英偉達(dá)GPU這類生態(tài)成熟的通用芯片,為什么在人工智能算法沒有最終成熟需要不斷改進(jìn)時(shí)FPGA會出現(xiàn)在一些應(yīng)用領(lǐng)域,而谷歌這類財(cái)大氣粗自己需求量很大的公司自己用ASIC的TPU。