日前,芯片行業(yè)的峰會Hot Chips 33召開,芯片行業(yè)的巨頭英特爾、AMD和IBM紛紛拿出來自己的最新技術(shù)和產(chǎn)品。AMD把市場上獲得成功的Zen3拿出來自我表演了一番。IBM在以前內(nèi)存共享的基礎(chǔ)上,搞出來緩存共享。
而最引人注目的是英特爾。英特爾除了拿出大小核的十二代酷睿以外,還拿出來一個驚世駭俗的頂級GPU產(chǎn)品。
這款GPU比nVIDIA最強大的GPU還要強很多,而更令人稱奇的是英特爾的GPU并不是傳統(tǒng)上的一塊大芯片,而是由47個小芯片通過英特爾的EMIB技術(shù)連接成一個整體。這讓參會者驚掉了下巴,紛紛質(zhì)疑這個東西能量產(chǎn)嗎?
一顆芯片47個模塊,英特爾為何要這樣搞?未來的CPU和GPU又會如何發(fā)展呢?我們來看一下。
一、英特爾為何要做GPU?
雖然英特爾起步的時候做過內(nèi)存,但是多年來,它都是以CPU產(chǎn)品聞名的,從奔騰處理器到酷睿處理器,英特爾常年占據(jù)高性能CPU的王座,AMD在漫長的40年里面,只翻盤了兩次。
英特爾也嘗試過做GPU,那也是20多年前的事情了。當年英特爾收購了洛克希德馬丁(造F22的廠商)旗下的3D技術(shù),發(fā)展出i740獨立顯卡,試圖在市場上爭鋒。
但是很快,顯卡市場就淘汰了英特爾,英特爾的圖形核心被集成到主板北橋芯片之中,后來又一起集成到CPU之中。成為入門級別的GPU解決方案。
那么,時隔20多年,為何英特爾又要重新做獨立顯卡,還要搞出一個47個模塊的怪獸與nVIDIA和AMD爭鋒呢?
原因很簡單,現(xiàn)在高性能計算已經(jīng)不用CPU了。
長期以來,人們都是用高性能的CPU做計算,但是后來人們發(fā)現(xiàn)高性能CPU用來做計算不經(jīng)濟,CPU是為復(fù)雜邏輯計算設(shè)計的,而很多計算只需要簡單計算,這樣晶體管都被浪費了。
于是,IBM搞出來一個Cell的方案(Cell是PS3游戲機的處理器),用一個全功能的CPU,帶上一堆暴力計算單元,這樣可以用比較少的晶體管,獲得比較強的計算能力。雖然編程麻煩一些,但是算力提升立竿見影。
差不多在同時,做顯卡的nVIDIA也發(fā)現(xiàn)一個問題,為了3D顯示把GPU搞出來強大的計算能力,平時用不少浪費啊,于是nVIDIA搞出來CUDA,把GPU中的計算單元通用化,用來算高性能計算。
這個道路走了十多年,遇到了人工智能的爆發(fā),人工智能是一個典型的需要海量簡單計算的應(yīng)用,GPU相比CPU有天然優(yōu)勢,結(jié)果大量高性能計算需求,都用GPU了,英特爾的計算產(chǎn)品市場被吃掉一大塊。
英特爾其實很早也嘗試過計算卡這類東西,也是用多個小核心組成一個類似于GPU的大型計算卡,但是這個東西只能計算,無法通過游戲市場分攤成本,價格高昂,競爭不過nVIDIA和AMD,經(jīng)過幾代產(chǎn)品也就淘汰了。
痛定思痛,英特爾決定也搞GPU,搞出來GPU,可以在家用游戲市場賣,分攤掉研發(fā)和制造成本,這個GPU用于高性能計算的成本就下來了,就可以與nVIDIA競爭了。所以英特爾做GPU。
二、英特爾為什么搞47個模塊的怪獸?
要做GPU,其實也不算太難。用先進的工藝,把計算單元做得足夠多,晶體管效率上去,顯存帶寬上去,自然有高性能。
但是,這里有一個問題,就是要把單元做的足夠多,GPU用掉的晶體管就要足夠多,GPU的芯片就要做得很大。而芯片的良率與芯片大小是有關(guān)的。
因為芯片上的瑕疵是隨機的,芯片面積越大,遇到瑕疵概率越大,遇到了就是廢品,廢品率高了,成品的價格就上去了。
那么,能不能用小芯片堆砌呢?當然可以,AMD的CPU就是這么干的,但是小芯片堆砌有個問題,是小芯片之間互聯(lián)會降低效率,性能會損失很大。所以,GPU現(xiàn)在還是用大芯片。
而英特爾有一個叫做EMIB的技術(shù),這個技術(shù)用一個比一顆香米粒還小的復(fù)雜多層薄硅片,可以在相鄰芯片間傳輸大量數(shù)據(jù)。比傳統(tǒng)電路基板的帶寬要高,可以解決多個小芯片互聯(lián)性能下降的問題。
有這個技術(shù),英特爾就開始發(fā)威了。它的旗艦GPU用個47個模塊,分成兩個部分。
兩個部分之間連接器用一個模塊,每個部分有23個模塊。這23個模塊,8個模塊是通用計算,8個模塊是AI用的計算,兩個模塊連接這些計算單元,四個模塊是存儲器,一個模塊用于外部互聯(lián)。
這樣就堆砌出47個模塊,建立起強大的算力,而單個芯片的良率遠比大芯片方案更高。
三、未來的芯片會走向何方?
隨著nVIDIA要約收購ARM,英特爾做GPU,目前在高性能計算市場上,nVIDIA,英特爾、AMD三足鼎立已經(jīng)形成。還有一個潛在的巨頭是獨立做CPU和GPU的蘋果。
這四家都希望有CPU和GPU,完成高性能計算。從目前各家的技術(shù)探索來看。未來很可能形成統(tǒng)一的幾個趨勢。
第一個趨勢是CPU和GPU統(tǒng)一內(nèi)存架構(gòu)。
現(xiàn)在AMD已經(jīng)把三級緩存做到192M了,也把GPU的緩存做到了128M,AMD也在游戲機里面做到了統(tǒng)一內(nèi)存架構(gòu)。統(tǒng)一內(nèi)存架構(gòu)可以提升CPU和GPU和數(shù)據(jù)交換速度,提升性能,未來隨著工藝的提升,CPU和GPU共享緩存,共享內(nèi)存是一個趨勢。
第二個趨勢是小芯片堆砌。小芯片的成本優(yōu)勢一直有,英特爾EMIB的技術(shù)解決了芯片之間互聯(lián)的帶寬問題,減少了性能損失,這樣一來,小芯片堆砌可以帶來高性能和低成本,這種方案會越來越多。
第三個趨勢是大小核,人們基本的計算需求對性能要求很低。用高性能核心,浪費功耗。而用大小核,可以在性能和功耗之間找到比較合適的平衡點。
所以,一顆芯片47個模塊只是開始,未來我們會看到更多的怪獸級芯片。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...