存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

作者|王嘉攀 司馬潔

本報(bào)告由勢(shì)乘資本和光錐智能聯(lián)合發(fā)布

在后摩爾時(shí)代,存算一體作為可10倍提升單位功耗下算力的顛覆性技術(shù)之一,其底層原理、應(yīng)用前景及可實(shí)現(xiàn)性如何?當(dāng)前的產(chǎn)業(yè)現(xiàn)狀及行業(yè)創(chuàng)新創(chuàng)業(yè)機(jī)遇如何?本文從底層技術(shù)原理、產(chǎn)業(yè)需求變革說(shuō)起,全面梳理存算一體產(chǎn)業(yè)創(chuàng)新浪潮與投資機(jī)遇圖景:

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

一、核心判斷及觀點(diǎn)

1.存算一體屬于芯片的底層架構(gòu)創(chuàng)新,階段非常早期,其產(chǎn)業(yè)鏈空白度及機(jī)遇挑戰(zhàn)不亞于20年前從頭開(kāi)始發(fā)展GPU。

2.相對(duì)于量子計(jì)算、光子芯片、非硅基芯片等前沿算力方案,受益于介質(zhì)等技術(shù)成熟,存算一體芯片更有希望在3-5年內(nèi)廣泛落地。

3.存算一體領(lǐng)域?qū)儆谏儆械膰?guó)內(nèi)外同時(shí)起步的芯片領(lǐng)域,中國(guó)更有希望做出引領(lǐng)世界的產(chǎn)品。

4.當(dāng)前產(chǎn)業(yè)界及投資方認(rèn)為產(chǎn)業(yè)鏈上下游仍不完善,仍需5-10年才能投入使用,但這也意味著更為全面的創(chuàng)新機(jī)遇。
5.當(dāng)前行業(yè)玩家競(jìng)爭(zhēng)主要集中在不同的存儲(chǔ)介質(zhì),長(zhǎng)期來(lái)看存儲(chǔ)介質(zhì)路線并無(wú)差別,在設(shè)計(jì)方法論、測(cè)試、量產(chǎn)、軟件、場(chǎng)景選擇等方面全方位競(jìng)爭(zhēng)是長(zhǎng)期關(guān)鍵。
6.第一款、第二款芯片場(chǎng)景的選擇非常重要,率先取得商業(yè)化驗(yàn)證,打造爆款是未來(lái)三年勝出關(guān)鍵。
7.作為新興技術(shù),產(chǎn)業(yè)人才主要集中于學(xué)界而非企業(yè)界,因此院校技術(shù)、人才轉(zhuǎn)化資源非常關(guān)鍵。
8.除創(chuàng)業(yè)公司外,大學(xué)院校及巨頭也在同步做研發(fā),長(zhǎng)期來(lái)看,真正強(qiáng)勁的競(jìng)爭(zhēng)對(duì)手可能是觀望中的巨頭。
9.存算一體芯片相對(duì)于CPU/GPU等主流算力并非是取代關(guān)系,未來(lái)將會(huì)成為主流算力的重要補(bǔ)充,更側(cè)重于高能效的算力。

二、存算一體技術(shù)的背景及原理

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

在全球數(shù)據(jù)量呈指數(shù)級(jí)暴漲,算力相對(duì)于AI運(yùn)算供不應(yīng)求的現(xiàn)狀下,存算一體技術(shù)主要解決了高算力帶來(lái)的高能耗成本矛盾問(wèn)題,有望實(shí)現(xiàn)降低一個(gè)數(shù)量級(jí)的單位算力能耗,在功耗敏感的百億級(jí)AIoT設(shè)備上、高能耗的數(shù)據(jù)中心、自動(dòng)駕駛等領(lǐng)域有望發(fā)揮其低功耗、低時(shí)延、高算力密度等優(yōu)勢(shì)。

在現(xiàn)有的成熟架構(gòu)及工藝下,當(dāng)前依靠制程技術(shù)進(jìn)步,增加晶體管密度提升算力、降低功耗已逐步趨于物理極限,且成本逐步提高;

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

在馮諾依曼架構(gòu)下,由于數(shù)據(jù)存儲(chǔ)與運(yùn)算單元分離,算力提升受限,功耗增加:

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

應(yīng)對(duì)存儲(chǔ)單元與計(jì)算單元分離的現(xiàn)狀,存算一體技術(shù)思路應(yīng)運(yùn)而生,在器件單元上存儲(chǔ)與計(jì)算單元融合,通過(guò)底層的架構(gòu)創(chuàng)新解決馮諾依曼架構(gòu)的固有瓶頸:

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

由于存儲(chǔ)介質(zhì)技術(shù)在近年來(lái)不斷突破,此外AIoT時(shí)代對(duì)于設(shè)備的智能化、低功耗、體積小、低時(shí)延等特性提出了天然要求(而現(xiàn)有的技術(shù)路線未能很好的滿足需求),在技術(shù)突破疊加市場(chǎng)需求的雙重作用力下,存算一體技術(shù)當(dāng)前已到達(dá)產(chǎn)業(yè)化爆發(fā)拐點(diǎn):

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

相對(duì)于五十多年前CPU的誕生以及二十多年前GPU的誕生,當(dāng)前存算一體技術(shù)仍處于早期階段,未來(lái)依靠其更好的并行度、更好的能效比等特性,有望成為智能化時(shí)代的主流算力平臺(tái)之一,與現(xiàn)有的算力解決方案互為補(bǔ)充。
伴隨架構(gòu)創(chuàng)新的巨大機(jī)遇和算力需求的變化,在存算一體領(lǐng)域有希望孕育下一個(gè)千億美元級(jí)的芯片巨頭,當(dāng)前我國(guó)存算一體技術(shù)研發(fā)與國(guó)外處于齊頭并進(jìn)的階段,我國(guó)存算一體技術(shù)及產(chǎn)業(yè)有望引領(lǐng)世界。

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

存算一體當(dāng)前有一些相似的稱(chēng)呼(如近存計(jì)算),其內(nèi)在結(jié)構(gòu)差別如下:

近存計(jì)算:不改變計(jì)算單元和存儲(chǔ)單元本身設(shè)計(jì)功能,通過(guò)采用先進(jìn)的封裝方式及合理的硬件布局和結(jié)構(gòu)優(yōu)化,增強(qiáng)二者間通信寬帶,增大傳輸速率;本質(zhì)上屬于馮諾依曼架構(gòu),通過(guò)拉近存儲(chǔ)單元和計(jì)算單元的距離,對(duì)“存儲(chǔ)墻”進(jìn)行優(yōu)化。

內(nèi)存儲(chǔ)計(jì)算:存儲(chǔ)單元與計(jì)算單元完全融合,無(wú)獨(dú)立計(jì)算單元,通過(guò)存儲(chǔ)器顆粒上嵌入算法,由存儲(chǔ)器芯片內(nèi)部的存儲(chǔ)單元完成計(jì)算操作;其設(shè)計(jì)難度更高,未來(lái)可提升的空間也更大,但需要獲得代工廠許可支持。本文所探討是存算一體/存內(nèi)計(jì)算企業(yè)主要集中于這類(lèi)。

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

三、存儲(chǔ)介質(zhì)技術(shù)路線的選擇

分析存算一體,當(dāng)前存算一體芯片研發(fā)企業(yè)/機(jī)構(gòu)在成熟介質(zhì)上的切入點(diǎn)集中在SRAM、Nor-Flash和DRAM等;部分學(xué)術(shù)機(jī)構(gòu)選擇切入RRAM等新型介質(zhì)研發(fā)。

從存儲(chǔ)介質(zhì)的分類(lèi)來(lái)講,分為易失性存儲(chǔ)器和非易失性存儲(chǔ)器。

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

上圖引自方正證券研報(bào)

當(dāng)前不同的存儲(chǔ)介質(zhì)在計(jì)算機(jī)架構(gòu)中均承擔(dān)著必要的工作任務(wù),其中SRAM距離CPU最近,響應(yīng)時(shí)間最快,存儲(chǔ)容量較??;

其次分別是DRAM、NAND-Flash等介質(zhì),在傳輸速率、存儲(chǔ)容量上各有其特點(diǎn):

1.易失性存儲(chǔ)器:即在正常關(guān)閉系統(tǒng)或者突然性、意外性關(guān)閉系統(tǒng)的時(shí)候,數(shù)據(jù)會(huì)丟失,成本高。

DRAM:內(nèi)存條(一個(gè)存儲(chǔ)單元僅需一個(gè)晶體管和一個(gè)小電容),占據(jù)58%的半導(dǎo)體存儲(chǔ)市場(chǎng)份額,當(dāng)前已突破20nm,往10nm過(guò)渡。

SRAM:CPU緩存(一個(gè)存儲(chǔ)單元需要4-6個(gè)晶體管),特點(diǎn)是速度最快(納秒級(jí)),不需要一直充電。

2.非易失性存儲(chǔ)器:在上述斷電情況下數(shù)據(jù)不會(huì)丟失,成本低。

NAND Flash:如固態(tài)硬盤(pán)、U盤(pán)和內(nèi)存;容量大,但讀寫(xiě)速度極低。

NOR Flash:代碼型內(nèi)存,主要存一些指令;如機(jī)頂盒、網(wǎng)關(guān)、路由器中嵌入代碼的存儲(chǔ);容量較小且寫(xiě)入數(shù)據(jù)極低,但讀速較快。

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

長(zhǎng)期來(lái)看,存算一體芯片產(chǎn)品化的快速發(fā)展離不開(kāi)新型存儲(chǔ)介質(zhì)成熟度提升的助推,以下為不同新型存儲(chǔ)介質(zhì)的原理比較:

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

長(zhǎng)期來(lái)看,RRAM(憶阻器)是除了電阻器、電容器、電感器之外的一大新發(fā)現(xiàn);其與生物神經(jīng)突觸有著非常類(lèi)似的特性,因此也被成為電子突觸器件。

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

以下為新型存儲(chǔ)介質(zhì)的性能比較:

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

以下為不同存儲(chǔ)介質(zhì)的存儲(chǔ)原理及客觀性能比較;其中成熟的存儲(chǔ)介質(zhì)如SRAM、DRAM、Flash基于電荷的移動(dòng)完成數(shù)據(jù)存儲(chǔ);新型存儲(chǔ)介質(zhì)與RRAM、MRAM等基于電阻大小的變化完成數(shù)據(jù)存儲(chǔ)功能。

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

除介質(zhì)以外,選擇數(shù)字計(jì)算與模擬計(jì)算也是影響存算一體芯片性能的因素之一;其中數(shù)字計(jì)算精度更高。

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

四、存算一體應(yīng)用場(chǎng)景

1.存算一體架構(gòu)與深度學(xué)習(xí)網(wǎng)絡(luò)運(yùn)算模型高度重合。

通用性計(jì)算芯片在服務(wù)特定AI算法方面并不具備性價(jià)比優(yōu)勢(shì),為AI定制的芯片將成為人工智能產(chǎn)業(yè)鏈條上的底層核心技術(shù)。

存內(nèi)計(jì)算作為創(chuàng)新芯片架構(gòu)形式,突破了存儲(chǔ)墻問(wèn)題,且其本質(zhì)是乘積累加運(yùn)算(Multiply Accumulate, MAC)操作加快的體現(xiàn),與深度學(xué)習(xí)網(wǎng)絡(luò)運(yùn)算模型中的基本算子高度契合,使得基于存內(nèi)計(jì)算架構(gòu)的芯片相比于市場(chǎng)已有的AI加速芯片,在計(jì)算效率(TOPS/W)方面有數(shù)量級(jí)上的提升。

智能時(shí)代里,從可穿戴到自動(dòng)駕駛,功耗約束下場(chǎng)景里的計(jì)算效率都是永恒的主題,存內(nèi)計(jì)算是解放算力、提升能效比最強(qiáng)有力的武器之一。

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

資料來(lái)源:《先進(jìn)存算一體芯片設(shè)計(jì)》、知乎陳巍探芯

2.存算一體芯片適用的行業(yè)/場(chǎng)景

(1)小算力場(chǎng)景:邊緣側(cè)對(duì)成本、功耗、時(shí)延、開(kāi)發(fā)難度非常敏感

中早期的存算一體芯片算力較小,從小算力1TOPS開(kāi)始往上走,解決的是音頻類(lèi)、健康類(lèi)及低功耗視覺(jué)終端側(cè)應(yīng)用場(chǎng)景,AI落地的芯片性能及功耗問(wèn)題。

我們預(yù)測(cè)從邊緣端接入的智能設(shè)備的市場(chǎng)體量將快速增長(zhǎng),智能產(chǎn)品覆蓋面積越來(lái)越大,產(chǎn)品形態(tài)的多樣性將迎來(lái)爆發(fā)式的增長(zhǎng)。可以預(yù)見(jiàn),由于傳輸延遲或數(shù)據(jù)安全考慮,很多數(shù)據(jù)處理及推理運(yùn)算將在端側(cè)發(fā)生。

(2)大算力場(chǎng)景:GPU在算力和能效上都無(wú)法同時(shí)與專(zhuān)用加速芯片競(jìng)爭(zhēng)

目前云計(jì)算算力市場(chǎng),GPU的單一架構(gòu)已經(jīng)不能適應(yīng)不同AI計(jì)算場(chǎng)景的算法離散化特點(diǎn),如在圖像、推薦、NLP領(lǐng)域有各自的主流算法架構(gòu)。
隨著存算一體芯片算力不斷提升,使用范圍逐漸擴(kuò)展到大算力應(yīng)用領(lǐng)域。針對(duì)大算力場(chǎng)景>100TOPS,在無(wú)人車(chē)、泛機(jī)器人、智能駕駛,云計(jì)算領(lǐng)域提供高性能大算力和高性價(jià)比的產(chǎn)品。
存算技術(shù)可支持成熟制程下匹配傳統(tǒng)結(jié)構(gòu)+高級(jí)節(jié)點(diǎn)才能提供的計(jì)算能力,節(jié)約制造成本,繞過(guò)工藝封鎖等問(wèn)題。
自動(dòng)駕駛要求很高,算力、可靠性、穩(wěn)定性需要同時(shí)達(dá)標(biāo),需要數(shù)年,目前仍有工藝挑戰(zhàn)和迭代,現(xiàn)在也還做不到數(shù)據(jù)中心的水平。

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

3.存算一體的其他延伸應(yīng)用:感存算一體、類(lèi)腦計(jì)算

存算一體作為基礎(chǔ)原理,同樣也衍生了如感存算一體、類(lèi)腦計(jì)算等創(chuàng)新技術(shù)方向:

(1)感存算一體:

傳統(tǒng)芯片,需要先利用傳感器芯片收集信息、存儲(chǔ)芯片進(jìn)行存儲(chǔ)、利用計(jì)算芯片來(lái)處理數(shù)據(jù)。感存算一體集傳感、儲(chǔ)存和運(yùn)算為一體,在存算一體的基礎(chǔ)上增加了傳感,三位合一提高整體效率。
在傳感器自身包含的AI存算一體芯片上運(yùn)算,來(lái)實(shí)現(xiàn)零延時(shí)和超低功耗的智能處理。
研究成果來(lái)看,包括壓力、光學(xué)、氣體三大類(lèi);從當(dāng)前應(yīng)用方向來(lái)看,包括實(shí)現(xiàn)更高效的機(jī)器視覺(jué)和類(lèi)腦計(jì)算。
(2)類(lèi)腦計(jì)算:
類(lèi)腦計(jì)算又被稱(chēng)為神經(jīng)形態(tài)計(jì)算,是借鑒生物神經(jīng)系統(tǒng)信息處理模式和結(jié)構(gòu)的計(jì)算理論、體系結(jié)構(gòu)、芯片設(shè)計(jì)以及應(yīng)用模型與算法的總稱(chēng)。
試圖借鑒人腦的物理結(jié)構(gòu)和工作特點(diǎn),讓計(jì)算機(jī)完成特定計(jì)算任務(wù),從而高速處理信息,屬于大算力高能效領(lǐng)域。
存算一體天然是將存儲(chǔ)和計(jì)算結(jié)合在一起的技術(shù),天然適合應(yīng)用在類(lèi)腦計(jì)算領(lǐng)域,并成為類(lèi)腦計(jì)算的關(guān)鍵技術(shù)基石。

五、產(chǎn)業(yè)現(xiàn)狀與未來(lái)趨勢(shì)

1.存算一體技術(shù)當(dāng)前面臨的挑戰(zhàn):
存算一體技術(shù)是一門(mén)非常復(fù)雜的綜合性創(chuàng)新,產(chǎn)業(yè)還算不上成熟,在產(chǎn)業(yè)鏈方面仍舊存在上游支撐不足,下游應(yīng)用不匹配的諸多挑戰(zhàn),但諸多的挑戰(zhàn)同時(shí)也構(gòu)成了當(dāng)前存算一體創(chuàng)新未來(lái)可構(gòu)筑的綜合性壁壘。

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

2.存算一體技術(shù)發(fā)展趨勢(shì):更高精度、更高算力、更高能效。

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

3.當(dāng)前產(chǎn)業(yè)面臨的人才及生態(tài)問(wèn)題:
(1)作為一個(gè)新領(lǐng)域,存算一體芯片復(fù)合型人才稀缺,人才更多在學(xué)術(shù)界。

完成存算一體芯片的產(chǎn)品化開(kāi)發(fā),需同時(shí)具備較強(qiáng)的學(xué)術(shù)原創(chuàng)能力(存算一體的架構(gòu)和編譯器設(shè)計(jì)、存算相關(guān)的量化算法開(kāi)發(fā)等)及工程實(shí)踐能力(場(chǎng)景理解能力、芯片落地能力)。
(2)從上游到下游的生態(tài)不完整,既是挑戰(zhàn)也是機(jī)遇。
存算一體芯片的大規(guī)模落地需與芯片廠商、軟件工具廠商以及應(yīng)用集成廠商等產(chǎn)業(yè)生態(tài)合作伙伴的大力協(xié)同研發(fā)和推廣應(yīng)用。
需有一套方便、可用的工具鏈和軟件,讓采購(gòu)方遷移成本低。
兼容現(xiàn)有的軟件生態(tài),讓采購(gòu)方用起來(lái)“無(wú)感”,如可直接利用現(xiàn)有GPU訓(xùn)練軟件框架。
引導(dǎo)采購(gòu)方逐步切入專(zhuān)用工具鏈進(jìn)行模型適配、壓縮等,更好利用存算一體的優(yōu)勢(shì),逐步建立生態(tài)。

六、行業(yè)相關(guān)企業(yè)分析

當(dāng)前我國(guó)存算一體芯片創(chuàng)新企業(yè)與海外創(chuàng)新企業(yè)屬于齊頭并進(jìn)階段,共同探索存算一體技術(shù)產(chǎn)業(yè)化落地及應(yīng)用場(chǎng)景,在AIoT時(shí)代巨大的應(yīng)用場(chǎng)景下,未來(lái)我國(guó)存算一體領(lǐng)域有望產(chǎn)生引領(lǐng)世界的創(chuàng)新企業(yè)。

國(guó)內(nèi)存算一體芯片企業(yè)有:蘋(píng)芯科技、后摩智能、知存科技、億鑄科技、智芯科、千芯科技、九天睿芯等創(chuàng)新企業(yè);國(guó)外有如Mythic、Syntiant等公司。
以下為國(guó)內(nèi)外部分存算一體企業(yè)簡(jiǎn)介:

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

附錄:賽道內(nèi)主要玩家的部分產(chǎn)品進(jìn)展及性能

存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限|深度研報(bào)

本文來(lái)自投稿,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://allfloridahomeinspectors.com/quan/98710.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2023-05-31 18:34
下一篇 2023-05-31

增長(zhǎng)黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評(píng)論
特別提示:登陸使用搜索/分類(lèi)/最新內(nèi)容推送等功能?>>