中國芯片重大突破!比英偉達GPU快1000倍,或另闢一條新賽道

1000倍!一項中國團隊的最新基準測試顯示,他們研發的新型模擬芯片,在特定任務上的吞吐量(速度)是英偉達H100高端GPU的1000倍,能效更是提升了100倍。

這不僅僅是一次芯片的提速,而可能為人工智能和6G時代海量數據處理構建了一種全新的計算範式。這項重大突破來自北京大學科研團隊,研究成果2025年10月13日發表在權威期刊《自然·電子學》(Nature Electronics)。

我們正處在一個數據爆炸的時代。從ChatGPT到6G通信,一切都依賴於超強的算力。但我們賴以生存的數字芯片,正一頭撞上“馮·諾依曼瓶頸”這堵牆。

現在的計算架構,就像一個“快手廚師”(處理器)配上一個“遠在天邊的冰箱”(內存)。廚師90%的時間都浪費在了往返冰箱取食材的路上,耗時又耗電。這就是為什麼你的GPU那麼燙。

於是,科學家們從故紙堆裡翻出了一個“老傢伙”——模擬計算。

這是一種古老的技術,它不用1和0,而是直接用物理電路本身(比如電流電壓)來進行計算。它的計算和存儲是“一體的”。

廚師和冰箱合體了!理論上,它可以快得飛起,且極其省電。

但這個老傢伙有個致命缺陷,一個困擾了學界百年之久的難題:它太“糊塗”了。

模擬信號極易受到干擾,算個加減法都可能出錯。就像一個喝醉了的數學天才,速度飛快,但你永遠不敢相信他的答案。因此,它一直被視為不切實際的屠龍之技。

直到今天,北大團隊找到了駕馭這個“醉酒天才”的方法。

他們的思路堪稱腦洞大開:我們不強迫他清醒,我們只讓他幹最擅長的事——快速出個大概,然後再找個清醒的助手來校準。

團隊使用了一種叫RRAM(憶阻器)的新型芯片,設計了一套“迭代組合拳”:

  1. 第一拳(閃電戰):先讓一個“低精度”模擬電路(LP-INV)出馬,它不管三七二十一,在120納秒內(比眨眼還快幾百萬倍)先算出一個“粗略答案”。
  2. 第二拳(精準點穴):馬上,另一個“高精度”模擬電路(HP-MVM)登場。它的任務不是重算,而是比較那個“粗略答案”和“標準答案”到底差了多少(即“殘餘誤差”)。
  3. 循環迭代:然後,把這個“誤差”再丟給第一個電路去算。

通過不斷重複這個循環迭代(粗略求解-> 精確修正誤差-> 再次粗略求解…),奇蹟發生了!

北大團隊的芯片,僅僅需要3次迭代,就達到了24位定點精度——這已經和英偉達GPU使用的FP32浮點精度旗鼓相當。

空有理論還不行。團隊直接把它用在了未來6G通信最難的“大規模MIMO”信號檢測上。結果顯示,這個模擬芯片的誤碼率,與FP32數字處理器算出來的結果“完全一致”。

既要又要還要,它全做到了!

這項研究的意義在於,它用一種巧妙的方式,把模擬計算的“超高速、超低能耗”和數字計算的“高精度”完美結合,一舉攻克了百年難題。它不是又一塊更快的數字芯片,它可能是一條全新的賽道,一個真正屬於AI和6G時代的“存算一體”新計算範式。

參考文獻:

左平,王Q.,羅Y.等。使用電阻式隨機存取存儲器芯片進行精確且可擴展的模擬矩陣方程求解。自然電子(2025)。

https://doi.org/10.1038/s41928-025-01477-0

分享你的喜愛