- 長沙瑞澤能源科技股份有限公司
- 電話:400-893-8081
- 傳真:0731-88578081
- 地址:長沙市岳麓區(qū)麓天路28號五礦麓谷科技產業(yè)園C12棟
行業(yè)動態(tài)
能效比提升超228倍 我國科學家研制出新型芯片
來源: 科技日報
發(fā)布時間: 2026-02-26
瀏覽次數: 132
非負矩陣分解是挖掘高維數據潛在結構的核心技術,廣泛應用于推薦系統(tǒng)、生物信息學、圖像處理等多個領域。北京大學人工智能學院孫仲研究員團隊瞄準這一技術,設計了一種模擬計算芯片,為大規(guī)模數據處理提供了全新高效方案。和當前先進數字芯片相比,計算速度可提升約12倍,能效比提升超過228倍,相關成果已于近日發(fā)表于《自然·通訊》。
孫仲1月22日告訴科技日報記者,非負矩陣分解是一種強大的“數據降維”技術。它能從巨量且龐雜的用戶行為、圖像像素等信息中,提煉出潛在的模式與特征,在圖像分析、信息聚類、個性化推薦等領域具有廣泛應用。但面對如今動輒百萬級規(guī)模的數據集,傳統(tǒng)數字硬件受計算復雜度和內存瓶頸限制,難以滿足實時處理需求。
孫仲團隊一直研究模擬計算。模擬計算直接利用物理定律實現并行運算,延時低、功耗低,在算力瓶頸背景下,具有先天優(yōu)勢。團隊此次研制出了基于阻變存儲器(RRAM)的非負矩陣分解模擬計算求解器,并創(chuàng)新性設計了一種可重構緊湊型廣義逆電路,通過電導補償原理,用最少的計算單元實現相同運算功能,對非負矩陣分解過程中最核心的計算步驟進行了優(yōu)化,實現一步求解,極大優(yōu)化了芯片的面積與能耗表現。
為驗證芯片性能,研究團隊搭建了測試平臺,在典型場景中進行驗證。在圖像壓縮任務中,和在全精度數字計算機上運行的結果相比,圖片精度損失相差無幾,還節(jié)省了一半的存儲空間;在推薦系統(tǒng)應用中,其預測誤差率和數字芯片計算結果高度相近。在MovieLens 100k數據集推薦系統(tǒng)訓練任務中,與主流可編程數字硬件相比,該模擬計算器實現了212倍的速度提升和4.6萬倍的能效提升;在網飛(Netflix)規(guī)模數據集的推薦系統(tǒng)訓練任務中,其計算速度較先進數字芯片提升約12倍,而能效比提升超過228倍。
“這項工作為非負矩陣分解這類約束優(yōu)化問題的實時求解開辟了新路徑,展現了模擬計算處理現實復雜數據的巨大潛力。”孫仲表示,該研究可為實時推薦系統(tǒng)、高清圖像處理、基因數據分析等場景帶來技術革新,助力人工智能應用向更高效、更低功耗方向發(fā)展。(記者張蓋倫)
孫仲1月22日告訴科技日報記者,非負矩陣分解是一種強大的“數據降維”技術。它能從巨量且龐雜的用戶行為、圖像像素等信息中,提煉出潛在的模式與特征,在圖像分析、信息聚類、個性化推薦等領域具有廣泛應用。但面對如今動輒百萬級規(guī)模的數據集,傳統(tǒng)數字硬件受計算復雜度和內存瓶頸限制,難以滿足實時處理需求。
孫仲團隊一直研究模擬計算。模擬計算直接利用物理定律實現并行運算,延時低、功耗低,在算力瓶頸背景下,具有先天優(yōu)勢。團隊此次研制出了基于阻變存儲器(RRAM)的非負矩陣分解模擬計算求解器,并創(chuàng)新性設計了一種可重構緊湊型廣義逆電路,通過電導補償原理,用最少的計算單元實現相同運算功能,對非負矩陣分解過程中最核心的計算步驟進行了優(yōu)化,實現一步求解,極大優(yōu)化了芯片的面積與能耗表現。
為驗證芯片性能,研究團隊搭建了測試平臺,在典型場景中進行驗證。在圖像壓縮任務中,和在全精度數字計算機上運行的結果相比,圖片精度損失相差無幾,還節(jié)省了一半的存儲空間;在推薦系統(tǒng)應用中,其預測誤差率和數字芯片計算結果高度相近。在MovieLens 100k數據集推薦系統(tǒng)訓練任務中,與主流可編程數字硬件相比,該模擬計算器實現了212倍的速度提升和4.6萬倍的能效提升;在網飛(Netflix)規(guī)模數據集的推薦系統(tǒng)訓練任務中,其計算速度較先進數字芯片提升約12倍,而能效比提升超過228倍。
“這項工作為非負矩陣分解這類約束優(yōu)化問題的實時求解開辟了新路徑,展現了模擬計算處理現實復雜數據的巨大潛力。”孫仲表示,該研究可為實時推薦系統(tǒng)、高清圖像處理、基因數據分析等場景帶來技術革新,助力人工智能應用向更高效、更低功耗方向發(fā)展。(記者張蓋倫)


