一顆芯片47個模塊，英特爾GPU的葫蘆賣得什么藥？

2021/09/03 11:07 maomaobear

　　日前，芯片行業(yè)的峰會Hot Chips 33召開，芯片行業(yè)的巨頭英特爾、AMD和IBM紛紛拿出來自己的最新技術(shù)和產(chǎn)品。AMD把市場上獲得成功的Zen3拿出來自我表演了一番。IBM在以前內(nèi)存共享的基礎(chǔ)上，搞出來緩存共享。

　　而最引人注目的是英特爾。英特爾除了拿出大小核的十二代酷睿以外，還拿出來一個驚世駭俗的頂級GPU產(chǎn)品。

　　這款GPU比nVIDIA最強(qiáng)大的GPU還要強(qiáng)很多，而更令人稱奇的是英特爾的GPU并不是傳統(tǒng)上的一塊大芯片，而是由47個小芯片通過英特爾的EMIB技術(shù)連接成一個整體。這讓參會者驚掉了下巴，紛紛質(zhì)疑這個東西能量產(chǎn)嗎?

　　一顆芯片47個模塊，英特爾為何要這樣搞?未來的CPU和GPU又會如何發(fā)展呢?我們來看一下。

　　一、英特爾為何要做GPU?

　　雖然英特爾起步的時候做過內(nèi)存，但是多年來，它都是以CPU產(chǎn)品聞名的，從奔騰處理器到酷睿處理器，英特爾常年占據(jù)高性能CPU的王座，AMD在漫長的40年里面，只翻盤了兩次。

　　英特爾也嘗試過做GPU，那也是20多年前的事情了。當(dāng)年英特爾收購了洛克希德馬丁(造F22的廠商)旗下的3D技術(shù)，發(fā)展出i740獨立顯卡，試圖在市場上爭鋒。

　　但是很快，顯卡市場就淘汰了英特爾，英特爾的圖形核心被集成到主板北橋芯片之中，后來又一起集成到CPU之中。成為入門級別的GPU解決方案。

　　那么，時隔20多年，為何英特爾又要重新做獨立顯卡，還要搞出一個47個模塊的怪獸與nVIDIA和AMD爭鋒呢?

　　原因很簡單，現(xiàn)在高性能計算已經(jīng)不用CPU了。

　　長期以來，人們都是用高性能的CPU做計算，但是后來人們發(fā)現(xiàn)高性能CPU用來做計算不經(jīng)濟(jì)，CPU是為復(fù)雜邏輯計算設(shè)計的，而很多計算只需要簡單計算，這樣晶體管都被浪費了。

　　于是，IBM搞出來一個Cell的方案(Cell是PS3游戲機(jī)的處理器)，用一個全功能的CPU，帶上一堆暴力計算單元，這樣可以用比較少的晶體管，獲得比較強(qiáng)的計算能力。雖然編程麻煩一些，但是算力提升立竿見影。

　　差不多在同時，做顯卡的nVIDIA也發(fā)現(xiàn)一個問題，為了3D顯示把GPU搞出來強(qiáng)大的計算能力，平時用不少浪費啊，于是nVIDIA搞出來CUDA，把GPU中的計算單元通用化，用來算高性能計算。

　　這個道路走了十多年，遇到了人工智能的爆發(fā)，人工智能是一個典型的需要海量簡單計算的應(yīng)用，GPU相比CPU有天然優(yōu)勢，結(jié)果大量高性能計算需求，都用GPU了，英特爾的計算產(chǎn)品市場被吃掉一大塊。

　　英特爾其實很早也嘗試過計算卡這類東西，也是用多個小核心組成一個類似于GPU的大型計算卡，但是這個東西只能計算，無法通過游戲市場分?jǐn)偝杀荆瑑r格高昂，競爭不過nVIDIA和AMD，經(jīng)過幾代產(chǎn)品也就淘汰了。

　　痛定思痛，英特爾決定也搞GPU，搞出來GPU，可以在家用游戲市場賣，分?jǐn)偟粞邪l(fā)和制造成本，這個GPU用于高性能計算的成本就下來了，就可以與nVIDIA競爭了。所以英特爾做GPU。

　　二、英特爾為什么搞47個模塊的怪獸?

　　要做GPU，其實也不算太難。用先進(jìn)的工藝，把計算單元做得足夠多，晶體管效率上去，顯存帶寬上去，自然有高性能。

　　但是，這里有一個問題，就是要把單元做的足夠多，GPU用掉的晶體管就要足夠多，GPU的芯片就要做得很大。而芯片的良率與芯片大小是有關(guān)的。

　　因為芯片上的瑕疵是隨機(jī)的，芯片面積越大，遇到瑕疵概率越大，遇到了就是廢品，廢品率高了，成品的價格就上去了。

　　那么，能不能用小芯片堆砌呢?當(dāng)然可以，AMD的CPU就是這么干的，但是小芯片堆砌有個問題，是小芯片之間互聯(lián)會降低效率，性能會損失很大。所以，GPU現(xiàn)在還是用大芯片。

　　而英特爾有一個叫做EMIB的技術(shù)，這個技術(shù)用一個比一顆香米粒還小的復(fù)雜多層薄硅片，可以在相鄰芯片間傳輸大量數(shù)據(jù)。比傳統(tǒng)電路基板的帶寬要高，可以解決多個小芯片互聯(lián)性能下降的問題。

　　有這個技術(shù)，英特爾就開始發(fā)威了。它的旗艦GPU用個47個模塊，分成兩個部分。

　　兩個部分之間連接器用一個模塊，每個部分有23個模塊。這23個模塊，8個模塊是通用計算，8個模塊是AI用的計算，兩個模塊連接這些計算單元，四個模塊是存儲器，一個模塊用于外部互聯(lián)。

　　這樣就堆砌出47個模塊，建立起強(qiáng)大的算力，而單個芯片的良率遠(yuǎn)比大芯片方案更高。

　　三、未來的芯片會走向何方?

　　隨著nVIDIA要約收購ARM，英特爾做GPU，目前在高性能計算市場上，nVIDIA，英特爾、AMD三足鼎立已經(jīng)形成。還有一個潛在的巨頭是獨立做CPU和GPU的蘋果。

　　這四家都希望有CPU和GPU，完成高性能計算。從目前各家的技術(shù)探索來看。未來很可能形成統(tǒng)一的幾個趨勢。

　　第一個趨勢是CPU和GPU統(tǒng)一內(nèi)存架構(gòu)。

　　現(xiàn)在AMD已經(jīng)把三級緩存做到192M了，也把GPU的緩存做到了128M，AMD也在游戲機(jī)里面做到了統(tǒng)一內(nèi)存架構(gòu)。統(tǒng)一內(nèi)存架構(gòu)可以提升CPU和GPU和數(shù)據(jù)交換速度，提升性能，未來隨著工藝的提升，CPU和GPU共享緩存，共享內(nèi)存是一個趨勢。

　　第二個趨勢是小芯片堆砌。小芯片的成本優(yōu)勢一直有，英特爾EMIB的技術(shù)解決了芯片之間互聯(lián)的帶寬問題，減少了性能損失，這樣一來，小芯片堆砌可以帶來高性能和低成本，這種方案會越來越多。

　　第三個趨勢是大小核，人們基本的計算需求對性能要求很低。用高性能核心，浪費功耗。而用大小核，可以在性能和功耗之間找到比較合適的平衡點。

　　所以，一顆芯片47個模塊只是開始，未來我們會看到更多的怪獸級芯片。

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

　　榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

一顆芯片47個模塊，英特爾GPU的葫蘆賣得什么藥？

最新新聞

熱門新聞

新動態(tài)

關(guān)注度

最話題

一顆芯片47個模塊，英特爾GPU的葫蘆賣得什么藥？

相關(guān)閱讀

最新新聞

熱門新聞

新動態(tài)

關(guān)注度

最話題

一顆芯片47個模塊，英特爾GPU的葫蘆賣得什么藥？