半導(dǎo)體產(chǎn)業(yè)中,存儲(chǔ)器的重要性不言而喻,特別是DRAM(動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)和NAND(閃存)兩大類別,它們不僅支撐起行業(yè)的半壁江山,還不斷催生新的增長(zhǎng)點(diǎn)。近年來,隨著生成式人工智能(AI)的崛起,特別是ChatGPT等技術(shù)的廣泛應(yīng)用,存儲(chǔ)器市場(chǎng)迎來了新的發(fā)展機(jī)遇,新型存儲(chǔ)技術(shù)如HBM、QLC SSD等備受矚目。
AI時(shí)代,計(jì)算能力固然重要,但存儲(chǔ)的作用同樣不可忽視。隨著生成式AI的火爆,非結(jié)構(gòu)化數(shù)據(jù)如圖像、視頻、音頻等呈現(xiàn)爆炸式增長(zhǎng),這對(duì)存儲(chǔ)提出了前所未有的挑戰(zhàn)。據(jù)IDC預(yù)測(cè),到2028年,全球數(shù)據(jù)產(chǎn)量將達(dá)到394ZB,其中AIGC領(lǐng)域的數(shù)據(jù)增長(zhǎng)尤為顯著,AI圖像和視頻生成數(shù)據(jù)量將激增167倍。
面對(duì)這一挑戰(zhàn),存儲(chǔ)逐漸成為AI發(fā)展的瓶頸。存內(nèi)計(jì)算作為一種創(chuàng)新的解決方案,近年來備受關(guān)注,但商業(yè)化進(jìn)程卻步履維艱。近日,三星電子與SK海力士宣布合作,共同推進(jìn)LPDDR6-PIM內(nèi)存產(chǎn)品的標(biāo)準(zhǔn)化。這一合作旨在加速專門用于AI的低功耗存儲(chǔ)器標(biāo)準(zhǔn)化進(jìn)程,有望為存內(nèi)計(jì)算的商業(yè)化注入新的動(dòng)力。
在AI領(lǐng)域,算法、數(shù)據(jù)和算力是三大核心要素,而算力(芯片)則是決定AI能否最終落地的關(guān)鍵。隨著ChatGPT、GPT-4等大模型研究的深入,模型結(jié)構(gòu)日益復(fù)雜,數(shù)據(jù)量與計(jì)算量大幅增長(zhǎng)。然而,摩爾定律的逐漸失效使得芯片制造工藝演進(jìn)放緩,算法發(fā)展與硬件發(fā)展之間的矛盾日益突出。如何高效利用復(fù)雜算法處理海量數(shù)據(jù),成為當(dāng)前AI領(lǐng)域的重要挑戰(zhàn)。
傳統(tǒng)的馮·諾依曼架構(gòu)中,計(jì)算與內(nèi)存分離,導(dǎo)致功耗墻、性能墻、內(nèi)存墻等問題凸顯。為了突破這些瓶頸,國(guó)內(nèi)外學(xué)術(shù)界和產(chǎn)業(yè)界從架構(gòu)、工藝、集成等多個(gè)維度展開研究,探索后摩爾時(shí)代的新一代芯片技術(shù)。其中,存算一體芯片通過器件、架構(gòu)、電路、工藝的協(xié)同創(chuàng)新,實(shí)現(xiàn)存儲(chǔ)與計(jì)算的融合一體化,被視為突破馮·諾依曼架構(gòu)瓶頸的重要途徑。
存算一體芯片具有三種主流技術(shù)路徑:近存計(jì)算(PNM)、存內(nèi)處理(PIM)、存內(nèi)計(jì)算(CIM)。近存計(jì)算通過減少數(shù)據(jù)移動(dòng)和提高緩存效率,適用于需要大規(guī)模并行處理和優(yōu)化內(nèi)存帶寬的應(yīng)用;存內(nèi)處理則注重?cái)?shù)據(jù)密集型應(yīng)用和能效優(yōu)化,適合快速數(shù)據(jù)處理和降低能耗;存內(nèi)計(jì)算則專注于特定領(lǐng)域的高并行性計(jì)算和定制硬件優(yōu)化,適用于高度專業(yè)化和定制化解決方案。
在存算一體的概念上,業(yè)界已經(jīng)進(jìn)行了多年的探索。從斯坦福研究所首次提出“l(fā)ogic-in-memory”方案,到后續(xù)研究人員在芯片電路結(jié)構(gòu)、計(jì)算架構(gòu)與系統(tǒng)應(yīng)用等方面的研究,存算一體的理念逐漸深入人心。然而,受限于電路設(shè)計(jì)復(fù)雜度與工藝難度,早期的研究大多停留在近存計(jì)算的層面,存算分離的問題依然存在。近年來,隨著大數(shù)據(jù)驅(qū)動(dòng)應(yīng)用的發(fā)展,數(shù)據(jù)量激增,研究者們開始考慮賦予內(nèi)存一定的計(jì)算能力,從而實(shí)現(xiàn)存儲(chǔ)和計(jì)算融合一體化的“存內(nèi)計(jì)算”架構(gòu)。
在巨頭們的布局中,存內(nèi)計(jì)算技術(shù)逐漸走向成熟。三星、海力士、TSMC等國(guó)際巨頭以及阿里巴巴達(dá)摩院等國(guó)內(nèi)企業(yè)紛紛投入研發(fā),推出了基于不同技術(shù)路徑的存內(nèi)計(jì)算芯片。例如,三星展示了基于HBM2-PIM技術(shù)的存內(nèi)計(jì)算芯片,提供了高達(dá)1.2 TFLOPS的嵌入式計(jì)算能力;阿里巴巴達(dá)摩院則成功研發(fā)了全球首款基于DRAM的3D鍵合堆疊存算一體AI芯片,在特定AI場(chǎng)景中性能提升10倍以上,能效比提升高達(dá)300倍。
然而,盡管各家企業(yè)都在積極布局存內(nèi)計(jì)算技術(shù),但商業(yè)化進(jìn)程卻受到標(biāo)準(zhǔn)化問題的制約。由于各家企業(yè)根據(jù)各自的標(biāo)準(zhǔn)開發(fā)產(chǎn)品,導(dǎo)致概念和規(guī)范存在差異,行業(yè)難以采用通用標(biāo)準(zhǔn)。為了推動(dòng)存內(nèi)計(jì)算的商業(yè)化進(jìn)程,三星電子和SK海力士正在合作推動(dòng)LPDDR6-PIM內(nèi)存的標(biāo)準(zhǔn)化。他們與聯(lián)合電子設(shè)備工程委員會(huì)(JEDEC)進(jìn)行標(biāo)準(zhǔn)化工作,討論確定每項(xiàng)標(biāo)準(zhǔn)的具體規(guī)格。
標(biāo)準(zhǔn)化的推進(jìn)將帶來多重好處。首先,它可以提升兼容性和互操作性,使得不同廠商生產(chǎn)的PIM設(shè)備可以在同一系統(tǒng)中無縫協(xié)作,減少因兼容性問題導(dǎo)致的系統(tǒng)故障或性能下降。其次,標(biāo)準(zhǔn)化有助于降低成本,減少研發(fā)成本和時(shí)間,促進(jìn)規(guī)模經(jīng)濟(jì),降低生產(chǎn)成本,從而使得PIM技術(shù)更加普及和實(shí)惠。標(biāo)準(zhǔn)化還將加速技術(shù)的廣泛應(yīng)用和普及,推動(dòng)存內(nèi)計(jì)算技術(shù)的快速發(fā)展。
除了三星和SK海力士的合作外,其他企業(yè)也在積極探索存內(nèi)計(jì)算技術(shù)。例如,TSMC展示了在SRAM、ReRAM、PCM、STT-MRAM等多種器件上實(shí)現(xiàn)存內(nèi)計(jì)算的探索成果;美國(guó)處理器公司Mythic推出了采用模擬存內(nèi)計(jì)算方案的M1076處理器;國(guó)內(nèi)知存科技則推出了首款量產(chǎn)存內(nèi)計(jì)算SOC芯片WTM2101,已商用至智能可穿戴設(shè)備中。這些產(chǎn)品的推出標(biāo)志著存內(nèi)計(jì)算產(chǎn)業(yè)化初見成果,越來越多的存內(nèi)計(jì)算產(chǎn)品開始落地。
隨著標(biāo)準(zhǔn)化進(jìn)程的加速和技術(shù)的不斷成熟,存內(nèi)計(jì)算芯片有望在未來大放異彩。這一技術(shù)的突破將不僅推動(dòng)半導(dǎo)體產(chǎn)業(yè)的發(fā)展,還將為AI時(shí)代的計(jì)算需求提供強(qiáng)有力的支持。