1. 痛點問題
隨著數(shù)據(jù)量的爆炸性增長,張量運算正在成為現(xiàn)代科技中非常重要的數(shù)學(xué)和計算機科學(xué)工具,并在機器學(xué)習(xí)、深度學(xué)習(xí)、計算機視覺和自然語言處理等人工智能領(lǐng)域得到廣泛應(yīng)用。基于馮·諾依曼架構(gòu)的傳統(tǒng)電子處理器處理激增的數(shù)據(jù)流越來越具挑戰(zhàn)性,光計算作為一個前沿計算技術(shù),利用光子而不是傳統(tǒng)的電子來完成信息處理和計算任務(wù),有望在某些應(yīng)用場景中克服傳統(tǒng)電子計算在并行性、帶寬、延遲或能耗等方面的瓶頸或局限性。因此,光子計算逐漸成為下一代高性能計算技術(shù)研究的新方向。當前的光子卷積處理器遵循電子卷積(如:Nvidia Ampere架構(gòu)的Tensor Core、華為Davinci架構(gòu)的CUBE Core等)的技術(shù)路徑,將張量卷積轉(zhuǎn)換為多通道的通用矩陣乘法運算(GeMM)。目前,光學(xué)張量卷積芯片主要存在以下兩個痛點問題:
(1) 該多通道數(shù)據(jù)流的矩陣乘法運算導(dǎo)致數(shù)據(jù)復(fù)制和光學(xué)硬件復(fù)雜性,大大增加了計算量和系統(tǒng)成本。
(2) 較低的光學(xué)權(quán)重精度降低了神經(jīng)網(wǎng)絡(luò)的計算精度,嚴重影響光子計算系統(tǒng)的實際應(yīng)用。
2. 解決方案
針對以上的核心痛點問題,南京大學(xué)現(xiàn)代工程與應(yīng)用科學(xué)學(xué)院的江偉課題組等聯(lián)合電子學(xué)院、人工智能學(xué)院的研究人員報道了一種單數(shù)據(jù)流、高權(quán)重精度的光子張量卷積處理器,主要的解決方案是:
(1) 為多通道張量數(shù)據(jù)提供了一種光學(xué)上的單通道卷積方法,大大減小了高速模擬器件的所需數(shù)量,可將系統(tǒng)小型化、并顯著降低成本。
(2) 利用光源直接單片集成的半導(dǎo)體光放大器(SOA)陣列被用作可編程權(quán)重庫,實現(xiàn)了9.2 bit的權(quán)重精度,滿足了張量卷積處理(TPU)的8 bit精度要求。
3. 競爭優(yōu)勢分析
在這項工作中,研究團隊提出的光子張量卷積處理器(PTPU),相對于其他方案,是一種更簡潔、精度更高的多通道張量單通道化的光學(xué)卷積方案。
(1) 根據(jù)所提出的算法規(guī)則,將高階張量中不同通道的像素混合并重新排列為一維向量。然后,光學(xué)波長、空間和時間維度的混合操作使得能夠在光學(xué)域中直接處理平坦的像素序列。因此,任意高階張量的所有輸入通道合并后只需要一個輸入調(diào)制器,相關(guān)高速器件所占空間比OPS方案小幾倍,成本也大幅度降低。
(2) 深度神經(jīng)網(wǎng)絡(luò)的實現(xiàn)通常依賴于一定的加權(quán)精度,如張量處理單元(TPU)通常具有8bit或更高的精度。研究團隊提出了一種光源-權(quán)重庫一體式集成的DFB-SOA陣列權(quán)重庫。使用單片集成的多波長激光器陣列被用作波長復(fù)用源,并且每個信道都配備有用于逐行幅度控制的專用SOA。SOA權(quán)重庫僅需要簡單的溫度控制,就能作為光子突觸提供9.2 bit的精度,滿足了張量計算需求。
研究團隊基于光子張量卷積處理器實現(xiàn)了高通量三維張量卷積,可有效識別新冠肺炎肺部計算機斷層掃描(CT)圖像,從而預(yù)測病毒性肺炎的存在。處理所需時間與基于電子計算機的神經(jīng)網(wǎng)絡(luò)相比降低幾個數(shù)量級。該技術(shù)在計算速度、有效帶寬和計算能耗等方面,相較目前的基于電子計算機的神經(jīng)網(wǎng)絡(luò)均存在顯著優(yōu)勢,有望在智能診斷、高維復(fù)雜數(shù)據(jù)處理、智能傳感等領(lǐng)域得到廣泛應(yīng)用。
掃碼關(guān)注,查看更多科技成果