阿里平頭哥首款CPU晶片釋出!5nm倚天710,單片600億電晶體


李根 魚羊 博雯 發自 雲棲小鎮

量子位 報道 | 公眾號 QbitAI

倚天一出,誰與爭鋒?

5nm、單芯600億電晶體、128核、主頻3.2GHz……首戰跑分就超出業內標杆20%,能效比提升50%以上。

這就是阿里平頭哥半導體,在2021雲棲大會現場交出的最新造芯成果。


取名倚天710,一顆自研雲端晶片,重新整理了Arm伺服器晶片效能紀錄。

更重要的是,這也是阿里平頭哥成立以來,第一顆通用晶片。

以“生死看淡,不服就幹”進軍造芯3年來,平頭哥先後推出了處理器IP玄鐵910、AI推理專用晶片含光800,並且落到地商用。

但CPU,作為計算機系統最核心單元,無論難度還是重要性,意義如何強調都不為過。

在專用晶片含光800釋出時,阿里巴巴集團CTO、達摩院院長張建鋒謙虛表示:這是平頭哥的萬里長征第一步。

而現在,隨著倚天710釋出,通用晶片的成功拿下,毫無疑問標誌著平頭哥半導體來到了一個更大的里程碑節點——長征路上的艱難一役已被攻克。

同時,對於開啟商業網際網路向硬科技轉型的阿里巴巴而言,亦是標誌性時刻。


倚天710,一顆怎樣的晶片?

一顆通用伺服器晶片(CPU),負責接收、處理、運算伺服器計算機內部所有資訊,是業內公認的設計難度最高的晶片之一。

但平頭哥出手,選定的就是最具挑戰的賽道。

倚天710採用業界最先進的5nm工藝,單晶片容納高達600億電晶體;在晶片架構上,基於最新的Arm v9架構,內含128核CPU,主頻最高達到3.2GHz。

記憶體和介面方面,同樣整合業界最領先的DDR5、PCIE5.0等技術,可以有效提升晶片的傳輸速率、適配雲的不同應用場景。

在行業基礎測試平臺SPECInt2017上,跑分高達440,超出此前業界標杆20%,首戰即巔峰。

而且效能巨獸還兼顧了功耗。

能效比相較業內標杆,實現了50%的優化,在資料中心應用中,節能減排意義不言自明。

沒錯,資料中心、雲服務,將是倚天710的最核心商用場景。

作為一顆高效能伺服器晶片,倚天710針對雲場景的高併發、高效能和高能效需求而設計,把最前沿的晶片設計技術與雲場景的獨特需求相結合,最終實現了效能和能效比的突破。

比如雲端計算高併發條件下的頻寬瓶頸,倚天710就對片上互聯進行了特殊優化設計,通過全新的流控演算法,有效緩解系統擁塞,從而提升了系統效率和擴充套件性。

這也是為什麼倚天710一出,Arm賽道伺服器CPU無人能與爭鋒關鍵原因。

Arm基礎設施事業部全球副總裁鄒挺就表示:

阿里巴巴作為公有云的頭部廠商之一,為其他雲服務提供商樹立了可以效仿的標杆。

對Arm來說,平頭哥在伺服器處理器倚天710晶片的研發成果無疑是一項重大的里程碑,同時也驗證了Arm IP在基礎設施領域的產品路線圖以及每瓦效能的優勢。

我們為平頭哥的技術團隊感到高興,期待繼續與平頭哥和阿里巴巴在晶片設計、軟體應用優化以及生態孵化方面開展進一步深入的合作。

但即便成果如斯,阿里雲智慧總裁、達摩院院長張建鋒,對倚天710強調更多的,還是客戶第一。

延伸閱讀  【Low-Fi隨聊第115期】A Step Forward—水月雨夸克簡評

他說,倚天710的釋出,是基於阿里雲“一雲多芯”和“做深基礎”的商業策略的結果,初心只是希望滿足客戶多樣性的計算需求。

所以也是在這種策略之下,倚天710不選擇對外出售,主要是阿里雲自用,與自研AI推理晶片含光800一樣,以雲服務方式實現價值輸出。

張建鋒還表示,將繼續與英特爾、英偉達、AMD、Arm等合作伙伴保持密切合作,為客戶提供更多選擇。

首款CPU如何煉成?

平頭哥不是上來就“敢”挑戰通用晶片的。

在倚天710之前,平頭哥先後交貨RISC-V處理器玄鐵910、首款專用晶片含光800,對於晶片設計和流片領域,已然不再是“新人”。

但即便如此,這也不代表可以輕而易舉跨越——專用晶片到通用晶片的技術鴻溝。

如果將專用晶片類比為人類負責某一項能力的神經元,那麼通用晶片,就好比大腦。

複雜性可見一斑。

所以哪怕半導體行業歷史已然不短,但全球範圍內,掌握CPU打造能力的半導體公司,也屈指可數。

可以明確的是,CPU是半導體行業設計門檻最高的晶片之一。

具體到資料中心領域,其CPU同樣是業內公認最複雜的晶片之一,其架構設計複雜,對效能、功耗要求極高……

平頭哥交貨之前,全球只有Intel、AMD、AWS、華為等公司掌握這樣的技術實力。

如果再算上製程、封裝,以及效能和功耗,能者更加寥寥。

而平頭哥不僅幹了,還一干就瞄準頂級效能,擠爆牙膏,把伺服器晶片帶進5nm時代。

關於晶片的工藝,用其另一個名字“積體電路”,可以更好理解。

晶片,就是由大量電晶體組成的複雜電路,其中電晶體的柵極是最窄的線條,這個線條的寬度就代表了工藝的大小。

工藝越小,單位面積所能容納的電晶體就越多,而晶片的效能也會越強,但這一數值越低,對技術的要求也越高。

在此之前,伺服器晶片最先進的工藝仍為7nm,如果倚天710設計之初就定位7nm,可能會更穩妥。

但如果要挑戰5nm,就得在能量密度、晶片內部結構佈局等方面,有更多開創性的工作。

據說在研發過程中,平頭哥團隊光EDA軟體排程就多達30多種,還度定製時鐘網路和定製IP技術,此外採用了先進的多晶片堆疊技術,就為確保了晶片效能、功耗的優化。

為什麼非要5nm?

回答是:沒得選。

平頭哥方面解釋,終端裝置的寸土寸金,讓外界更容易理解制程工藝之於CPU的重要性。

但易於忽略的是,用於伺服器的高效能CPU,同樣對製程工藝要求極高。

隨著算力需求突飛猛進,對伺服器CPU的效能要求也在水漲船高。

如果平頭哥選擇7nm,甚至退回10nm,不僅會導致面積上的增加,而且難於放下更多的Core……

另一方面,製程越先進,晶片越小,運營成本節省也會越多。

在資料中心領域,評價晶片有專門的重要維度叫TCO,即總擁有成本,所以資料中心晶片對於功耗異常敏感,更先進的製程,會在7×24小時運轉運營中,節省更多的電力成本。

所以在研發過程中,“潛在客戶”阿里雲,就明確在效能、製程工藝和功耗方面,提出了更高的要求:

如果不能比現有方案更好,那就沒有升級的必要。

如果不能比現有方案更強,也缺乏升級的說服力。

從這個維度來說,不難理解平頭哥團隊透露的“唯有最頂級才能生存”。

這不僅是自身產品能力的證明,更是平頭哥商業化、可持續經營的題中之義。

與絕大多數晶片公司不同,平頭哥的模式並非直接晶片對外售賣,而是服務雲端,以阿里雲對外輸出,其最大客戶就是阿里雲。

但也是這種原因,讓倚天710的首戰即巔峰,多少有點制度優勢的意味。

因為背靠阿里雲這個全球前三的雲平臺,平頭哥的雲端晶片,從定義和設計之初,就比獨立供應商更能深刻理解資料中心的業務場景和需求。

可以說是真正面向需求的晶片設計模式,最終追求的也是晶片即服務。

延伸閱讀  觸控拼接屏越來越受顧客歡迎,有什麼優勢呢?福建星視美科技總結

這也能解釋,不論是AI推理晶片含光800,還是伺服器CPU倚天710,為何都能有如此矚目的效能提升。

不過值得注意的是,阿里平頭哥的晶片推進,不光是這種效能上的縱深突破。

在本次雲棲大會現場,另一則生態建設方向的軟進展,同樣可能影響深遠——

平頭哥方面正式宣佈:開源玄鐵RISC-V系列處理器,並開放相關工具及系統軟體。

這也是釋出玄鐵910等處理器IP後,平頭哥在RISC-V生態上的重要舉措,成為了系列處理器與基礎軟體的全球首次全棧開源案例。

在玄鐵910推出時,我們就介紹過“一個時代有一個時代的晶片”。

RISC-V架構因其開放、靈活的特性,有望成為繼Intel x86、Arm後的下一代廣泛應用的CPU架構。

但當前RISC-V架構面臨的挑戰也非常直接:應用碎片化、開發效率低、軟硬體適配難等等。

歸結起來就是,軟硬體生態尚需更上一層樓。

而玄鐵開源,可謂穩準狠出擊,切中RISC-V生態發展剛需。

在AIoT領域中,平頭哥自研推出的玄鐵RISC-V系列處理器,覆蓋從低功耗到高效能的各類場景,支援AliOS、FreeRTOS、RT-Thread、Linux、Android等作業系統,並已成功應用於微控制器、工業控制、智慧家電、智慧電網、影象處理、人工智慧、多媒體和汽車電子等領域。

目前出貨更是已超25億顆,擁有超150家客戶、超500個授權數,成為國內應用規模最大的國產CPU。

所以此時開源,生態拓展的目的,再明確不過。

而且對於觀察平頭哥,這同樣是一則意義明確的風向標註腳:

這家2018年成立的半導體公司,雄心和價值,不會止於哪款晶片本身。

倚天710之後,再看平頭哥?

時間重回3年前,依然是雲棲大會。

那年阿里巴巴官宣造芯投入最大升級,成立平頭哥半導體公司。

外界都關注熱議“生死看淡,不服就幹”的平頭哥精神,但對於阿里這次高調造芯的未來之路,並非沒有質疑。

它是一個佈局已久的決定。

從2016年阿里投資軟體定義網路(SDN)晶片公司Barefoot,其後延展覆蓋AI晶片、物聯網晶片等領域,將翱捷科技、寒武紀、深鑑、耐能(Kneron)、中天微、恆玄科技等納入旗下。

同時達摩院中,組建起一支由半導體行業的工業界和學術界頂級專家組成的技術團隊,研究方向全面涵蓋系統架構、計算技術、儲存技術以及晶片工程等核心晶片設計技術,然後成立平頭哥後,率先在AI專用晶片領域取得成果。

但平頭哥的推進,依然被認為是一次過於大膽的跨界嘗試。

即便全球範圍內,也還沒有哪家公司,能夠短短數年內,完成專用晶片到通用晶片的跨越。

所以倚天710交貨,不僅是平頭哥已具備複雜大晶片設計能力的證明,也是阿里造芯標誌性一役。

如果說AI專用晶片含光800的釋出,被視為萬里長征第一步。

那通用晶片倚天710,則表明阿里造芯的長征行軍,完成關鍵一役。

現在平頭哥交出的成果和晶片能力證明,足以躋身頂級半導體公司序列。

其次,這同樣也是22歲阿里巴巴的歷史性時刻。

在阿里內部,2009年成立阿里雲、啟動飛天作業系統,被看作探索前沿科技的開端。

然而過去10年來,阿里的成功,更多被認為是商業上的成功、運營上的成功,而不是科技實力上的成功。

直到2017年達摩院推出,包含AI、量子計算、自動駕駛、晶片和5G等前沿技術領域探索被明確,才讓人感知到商業巨頭面向硬科技轉身的強烈決心。

而平頭哥半導體,就是這種轉型努力的集大成者。

在最硬核、最底層的晶片半導體領域,從釋出RISC-V玄鐵處理器,到釋出AI晶片含光800、通用伺服器晶片倚天710,平頭哥三年完成“三級跳”。

這種跨越並不容易,但正是這種難,方能證明前進方向的必要性和正確性。

幸運的是,阿里再次用成果說話,把相信變成了看見。

所以倚天710交貨,同樣也是阿里硬科技再上新臺階,從商業公司向硬科技公司轉身的標誌性時刻。

延伸閱讀  老客戶雙面夾換新活動詳情

當然,這甚至不止於阿里一家公司本身。

過去幾年風風雨雨裡,中國在晶片領域面臨的客觀現實,震驚了所有人,教育了所有人。

中國最大的出口商品是什麼?

品類有爭論。

但中國最大的進口商品是什麼?

答案有且只有一個:晶片半導體。

儘管在晶片設計領域,不同的力量正在快馬加鞭補足短板。

但高效能CPU市場,建樹有限,始終處於落後待供應狀態。

而現在,5nm倚天710一出,局面得到根本性扭轉,在高效能伺服器晶片領域,新的標杆和燈塔,日出東方。

這或許也是阿里平頭哥團隊,將這款晶片以倚天來命名的原因。

有意思的是,自交貨以來,平頭哥團隊就選取中國上古和武俠中的“神兵利劍”成為每一款產品的江湖代稱。

玄鐵是“重劍無鋒,大巧不工”的處理器IP。

含光是“視不可見,無往不利”的AI專用晶片。

而倚天……首款CPU晶片。

倚天一出,誰與爭鋒?!

—完—

Scroll to Top