人工智能研究AI芯片行業(yè)現(xiàn)狀趨勢(shì)及廠商情況分析
一、人工智能芯片發(fā)展現(xiàn)狀及趨勢(shì)
1.1、深度學(xué)習(xí)算法對(duì)芯片要求更為苛刻,通用CPU性價(jià)比相對(duì)較差
經(jīng)歷了60多年的起起伏伏之后,人工智能終于迎來(lái)了第三次爆發(fā)。第三次爆發(fā)的核心引爆點(diǎn)是深度學(xué)習(xí)算法的出現(xiàn),但其背后的支撐是數(shù)據(jù)和算力。對(duì)整個(gè)AI行業(yè)來(lái)講,算法、數(shù)據(jù)和算力三大基本要素中,數(shù)據(jù)尤其是海量數(shù)據(jù)的獲取和處理難度在下降,算法也在深度學(xué)習(xí)模型的基礎(chǔ)上不斷優(yōu)化,而負(fù)責(zé)將數(shù)據(jù)和深度算法統(tǒng)一協(xié)調(diào)起來(lái)的芯片能否獲得大的飛躍,成為市場(chǎng)關(guān)注的焦點(diǎn)。
深度學(xué)習(xí)算法對(duì)芯片性能需求主要表現(xiàn)在三個(gè)方面:一、海量數(shù)據(jù)在計(jì)算和存儲(chǔ)單元之間的高速通信需求。這不但需要芯片具備強(qiáng)大的緩存和片上存儲(chǔ)能力,而且還需要計(jì)算和存儲(chǔ)單元之間有較大的通信帶寬。二、專用計(jì)算能力需求高。深度學(xué)習(xí)算法中有大量卷積、殘差網(wǎng)絡(luò)、全連接等特殊計(jì)算需要處理,還需要提升運(yùn)算速度,降低功耗。三、海量數(shù)據(jù)自身處理同樣也對(duì)芯片提出了新的要求,尤其是非結(jié)構(gòu)化數(shù)據(jù)的增多,對(duì)傳統(tǒng)芯片結(jié)構(gòu)造成了較大的壓力。
通用CPU在深度學(xué)習(xí)中可用但效率較低。比如在圖像處理領(lǐng)域,主要用到的是CNN(卷積神經(jīng)網(wǎng)絡(luò)),在自然語(yǔ)言識(shí)別、語(yǔ)音處理等領(lǐng)域,主要用到的是RNN(循環(huán)神經(jīng)網(wǎng)絡(luò)),雖然這兩種算法模型有著較大的區(qū)別,但本質(zhì)上都是向量和矩陣運(yùn)算,主要是加法和乘法,輔助一些除法和指數(shù)運(yùn)算。傳統(tǒng)CPU可用于做上述運(yùn)算,但是CPU還有大量的計(jì)算邏輯控制單元,這些單元在AI計(jì)算中是用不上的,造成了CPU在AI計(jì)算中的性價(jià)比較低。
1.2、GPU、FPGA以及ASIC各有優(yōu)劣,成為當(dāng)前AI芯片行業(yè)的主流
正因?yàn)镃PU在AI計(jì)算上的弱點(diǎn),給了可以實(shí)現(xiàn)海量并行計(jì)算且能夠?qū)M(jìn)行計(jì)算加速的AI芯片留下了市場(chǎng)空間。從廣義上講,面向AI計(jì)算的芯片都可以稱為AI芯片,包括基于傳統(tǒng)架構(gòu)的GPU、FPGA以及ASIC(專用芯片),也包括正在研究但離商用還有較大差距的類(lèi)腦芯片、可重構(gòu)AI芯片等。
云端訓(xùn)練芯片市場(chǎng)較為集中,而推理市場(chǎng)云、邊兩端均有大量企業(yè)參與
按照部署位置劃分,AI芯片可以分為云端芯片和邊緣端芯片。云端芯片部署位置包括公有云、私有云或者混合云等基礎(chǔ)設(shè)施,主要用于處理海量數(shù)據(jù)和大規(guī)模計(jì)算,而且還要能夠支持語(yǔ)音、圖片、視頻等非結(jié)構(gòu)化應(yīng)用的計(jì)算和傳輸,一般情況下都是用多個(gè)處理器并行完成相關(guān)任務(wù);邊緣端AI芯片主要應(yīng)用于嵌入式、移動(dòng)終端等領(lǐng)域,如攝像頭、智能手機(jī)、邊緣服務(wù)器、工控設(shè)備等,此類(lèi)芯片一般體積小、耗電低,性能要求略低,一般只需具備一兩種AI能力。
按照承擔(dān)的任務(wù)分,AI芯片可以劃分為訓(xùn)練芯片和推理芯片。訓(xùn)練是指通過(guò)大量標(biāo)記過(guò)的數(shù)據(jù)在平臺(tái)上進(jìn)行“學(xué)習(xí)”,并形成具備特定功能的神經(jīng)網(wǎng)絡(luò)模型;推理則是利用已經(jīng)訓(xùn)練好的模型輸入新數(shù)據(jù)通過(guò)計(jì)算得到各種結(jié)論。訓(xùn)練芯片對(duì)算力、精度要求非常之高,而且還需要具備一定的通用性,以適應(yīng)多種算法的訓(xùn)練;推理芯片更加注重綜合能力,包括算力能耗、時(shí)延、成本等因素。
綜合來(lái)看,訓(xùn)練芯片由于對(duì)算力的特殊要求,只適合在云端部署,而且多采用的是“CPU+加速芯片”類(lèi)似的異構(gòu)模式,加速芯片可以是GPU,也可以是FPGA或者是ASIC專用芯片。AI訓(xùn)練芯片市場(chǎng)集中度高,英偉達(dá)和谷歌領(lǐng)先,英特爾和AMD正在積極切入。推理在云端和終端都可進(jìn)行,市場(chǎng)門(mén)檻相對(duì)較低,市場(chǎng)參與者較多。云端推理芯片除了傳統(tǒng)的英偉達(dá)、谷歌、賽靈思等芯片大廠外,Groq等國(guó)際新興力量也在加入競(jìng)爭(zhēng),國(guó)內(nèi)寒武紀(jì)、比特大陸也有不錯(cuò)表現(xiàn);終端推理芯片市場(chǎng)較為分散,場(chǎng)景各異,參與者除了英偉達(dá)、英特爾、ARM和高通之外,國(guó)內(nèi)企業(yè)如寒武紀(jì)、地平線、云知聲、云天勵(lì)飛等在各自細(xì)分領(lǐng)域均有所建樹(shù)。
人工智能專業(yè)前景如何?
極其好。如果說(shuō)計(jì)算機(jī)專業(yè)是上個(gè)時(shí)代的老大,那么人工智能專業(yè)就是下個(gè)時(shí)代的龍頭。因?yàn)椋?/p>
1. 大數(shù)據(jù)、芯片計(jì)算能力、5G網(wǎng)絡(luò)的發(fā)展使得AI人工智能得以高速發(fā)展。目前在自動(dòng)駕駛、智能家居、工業(yè)制造等很多領(lǐng)域,人工智能都在快速突破。例如預(yù)計(jì)5-10年后,美國(guó)有50%的車(chē)輛將是無(wú)人駕駛。
2. 真正的人工智能公司發(fā)展?jié)摿艽螅? 人才更容易脫穎而出。如人工智能芯片公司“深鑒科技”,由四名清華高手僅僅創(chuàng)立2年后被收購(gòu),收購(gòu)價(jià)3-4億美元。當(dāng)然,該專業(yè)的工資也很高,真正的人工智能崗位年薪百萬(wàn)比較容易。
人工智能專業(yè)的要求高么?
很高。該專業(yè)的前景有多好,對(duì)應(yīng)的專業(yè)要求就有多高。 人工智能是計(jì)算機(jī)+數(shù)學(xué)建模的結(jié)合,該專業(yè)要求有極其好的數(shù)學(xué)邏輯能力,能把該專業(yè)真正學(xué)明白的估計(jì)沒(méi)多少人。 例如給你1萬(wàn)張手機(jī)自拍人臉照片,讓你通過(guò)編程,建立一個(gè)數(shù)學(xué)模型識(shí)別出照片中哪些人臉是高興的表情。你需要把照片轉(zhuǎn)化為計(jì)算機(jī)可處理數(shù)據(jù),例如不同格式不同尺寸的圖片如何統(tǒng)一處理;你需要搭建模型來(lái)判斷數(shù)據(jù)有什么規(guī)律是表示高興,例如計(jì)算嘴角的弧度、眉頭的皺紋等等,同時(shí)要考慮不同年齡不同人種的臉部特點(diǎn);模型要經(jīng)過(guò)大量訓(xùn)練來(lái)優(yōu)化,這會(huì)需要大量的計(jì)算機(jī)處理能力(例如幾十臺(tái)服務(wù)器),需要設(shè)計(jì)優(yōu)秀的程序來(lái)保證訓(xùn)練過(guò)程盡量減少計(jì)算機(jī)的消耗以及減少計(jì)算時(shí)間(如并行計(jì)算)。
因此,基本是絕對(duì)的數(shù)學(xué)學(xué)霸可以真正搞定該專業(yè)。