0已點贊

南京大學(xué)王欣然教授團隊提出基于二維材料的高效稀疏神經(jīng)網(wǎng)絡(luò)硬件方案

研發(fā)快訊 2025年01月14日 15:01:04來源：南京大學(xué) 14017

摘要近日，王欣然教授領(lǐng)導(dǎo)的合作團隊發(fā)布最新研究進展：基于二維材料的高效稀疏神經(jīng)網(wǎng)絡(luò)硬件解決方案。

　　【儀表網(wǎng) 研發(fā)快訊】近日，王欣然教授領(lǐng)導(dǎo)的合作團隊發(fā)布最新研究進展：基于二維材料的高效稀疏神經(jīng)網(wǎng)絡(luò)硬件解決方案。

　　稀疏性 (Sparsity) 是人腦中的神經(jīng)突觸的本征屬性。在大腦發(fā)育過程中，超過一半的突觸會以細(xì)粒度和非結(jié)構(gòu)化的方式被剪枝 (Pruning)，這是人腦具有高能效的關(guān)鍵因素。受此啟發(fā)，稀疏神經(jīng)網(wǎng)絡(luò) (Sparse neural network) 早在上世紀(jì)九十年代就被提出，已成為人工智能輕量化的主流路徑。

　　雖然稀疏神經(jīng)網(wǎng)絡(luò)中90%的權(quán)重可以被剪枝，但剪枝過程中需要反復(fù)與外部存儲設(shè)備進行索引(Indexing)，消耗了整個系統(tǒng)90%以上的能耗和時延。類比于分離計算和存儲的馮·諾依曼瓶頸，索引過程成為稀疏神經(jīng)網(wǎng)絡(luò)硬件的瓶頸(圖1)。目前產(chǎn)業(yè)界主流方案為英偉達(dá)自A100芯片開始提出的大粒度、結(jié)構(gòu)化剪枝 (Structured pruning)，其本質(zhì)是通過一定程度的精度犧牲來減輕索引開銷，并未在根本上解決索引瓶頸。

圖1 硬件的索引瓶頸造成稀疏神經(jīng)網(wǎng)絡(luò)效率低下

　　為了解決稀疏神經(jīng)網(wǎng)絡(luò)軟硬件不適配的問題，王欣然教授領(lǐng)導(dǎo)的合作團隊借鑒了神經(jīng)生物學(xué)模型：支持突觸產(chǎn)生、剪枝、重新生長等動態(tài)行為的，并非神經(jīng)元本身，而是環(huán)繞在神經(jīng)元和突觸周圍的星形膠質(zhì)細(xì)胞 (Astrocytes) 和小膠質(zhì)細(xì)胞 (Microglial) 。受此啟發(fā)，稀疏性信息在位置上也需要盡可能接近權(quán)重信息，并直接參與稀疏運算。

　　在本工作中，團隊首次提出了“存內(nèi)稀疏”計算架構(gòu) (In-Memory Sparsity)，其把稀疏神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程抽象為稀疏矩陣和權(quán)重矩陣的Hadamard乘積，并集成在一個單元內(nèi)部 (圖2)。整個稀疏網(wǎng)絡(luò)的硬件基于二硫化鉬 (MoS2)鐵電晶體管技術(shù)，每個單元包含兩個鐵電晶體管，其中模擬鐵電晶體管用于存儲權(quán)重數(shù)據(jù)，而數(shù)字鐵電晶體管用于編碼稀疏性信息，直接決定權(quán)重是否被修剪。稀疏性信息被提前編程而免除了外部索引，從而大大降低了稀疏神經(jīng)網(wǎng)絡(luò)訓(xùn)練的開銷。

圖2 “存內(nèi)稀疏”架構(gòu)設(shè)計

　　為支撐存內(nèi)稀疏架構(gòu)芯片級并行計算，團隊開發(fā)了以矢量近似更新算法 (Vectorial Approximate Updating, VAU) 為核心的軟件-硬件協(xié)同優(yōu)化方法 (Software-Hardware Co-Optimization, SHCO)。其要點在于：摒棄傳統(tǒng)更新方案中完全精確但低效的逐個單元更新、以及高效卻失準(zhǔn)的行列更新，而是在預(yù)先的稀疏性編碼的基礎(chǔ)上，以行列為最小單元進行近似更新。結(jié)果表明，VAU算法在稀疏硬件上實現(xiàn)的精確度可以和理論值媲美，證明了軟硬件協(xié)同優(yōu)化的必要性?；诖鎯?nèi)稀疏架構(gòu)和軟硬件協(xié)同優(yōu)化方法，團隊制備了硬件陣列，完成了多種稀疏訓(xùn)練過程的片上實測：包括預(yù)訓(xùn)練、剪枝、過剪、以及重新生長，最后在75%的稀疏率下實現(xiàn)了98.4%的EMNIST手寫字母分類 (圖3)。

　　為了證明硬件方案的可拓展性，團隊基于NeuroSim仿真工具，將經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)VGG8-Net部署在三種不同的硬件架構(gòu)上：密集硬件、傳統(tǒng)稀疏硬件、以及本文提出的免索引稀疏硬件。仿真證明，存內(nèi)稀疏架構(gòu)的免索引稀疏硬件，首次基于極細(xì)粒度和非結(jié)構(gòu)化稀疏性，實現(xiàn)一個數(shù)量級的能耗和時延收益。

圖3 基于免索引硬件的片上稀疏訓(xùn)練

　　綜上所述，受人腦啟發(fā)，團隊首次提出了稀疏神經(jīng)網(wǎng)絡(luò)的“存內(nèi)稀疏”計算架構(gòu)，并基于二維半導(dǎo)體鐵電晶體管技術(shù)進行了免索引單元開發(fā)和陣列級片上演示，打破了稀疏神經(jīng)網(wǎng)絡(luò)硬件長期面臨的瓶頸。本工作也充分展示了二維半導(dǎo)體等新材料、新器件技術(shù)賦能人工智能硬件的巨大潛力：二維材料具有低溫后道工藝兼容的特點，可以與成熟的硅基電路進行三維單片集成，突破先進封裝技術(shù)在互聯(lián)密度方面的局限，進一步提升近存、存算芯片的能效。

　　該成果以“An index-free sparse neural network using two-dimensional semiconductor ferroelectric field-effect transistors”為題發(fā)表于國際頂級期刊《Nature Electronics》。南京大學(xué)電子學(xué)院博士生寧宏凱、溫恒迪、碩士生孟苑為共同第一作者，王欣然教授(南京大學(xué)，蘇州實驗室)、于志浩教授(南京郵電大學(xué))、傅玉祥副教授(南京大學(xué))為論文通訊作者，共同作者還包括南京大學(xué)施毅教授、李麗教授、李衛(wèi)勝副教授、李濤濤副教授、南京郵電大學(xué)高麗教授等。該工作得到了國家重點研發(fā)項目、國家自然科學(xué)基金、江蘇省前沿引領(lǐng)等項目的支持。王欣然教授感謝新基石科學(xué)基金會科學(xué)探索獎和雅辰基金的大力支持。

我要評論

昵稱

匿名

文明上網(wǎng)，理性發(fā)言。（您還可以輸入200個字符)

表情

所有評論僅代表網(wǎng)友意見，與本站立場無關(guān)。

儀表網(wǎng)首頁資訊首頁

延伸閱讀

版權(quán)與免責(zé)聲明

凡本網(wǎng)注明"來源：儀表網(wǎng)"的所有作品，版權(quán)均屬于儀表網(wǎng)，未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的，應(yīng)在授權(quán)范圍內(nèi)使用，并注明"來源：儀表網(wǎng)"。違反上述聲明者，本網(wǎng)將追究其相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它來源的作品，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性，不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時，必須保留本網(wǎng)注明的作品來源，并自負(fù)版權(quán)等法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問題，請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系，否則視為放棄相關(guān)權(quán)利。
合作、投稿、轉(zhuǎn)載授權(quán)等相關(guān)事宜，請聯(lián)系本網(wǎng)。聯(lián)系電話：0571-87759945，QQ：1103027433。