[No.H002]
這些新架構(gòu)將為即將推出的高性能產(chǎn)品注入動力,并為英特爾的下一個創(chuàng)新時代奠定基礎(chǔ),以滿足世界對高計算能力日益增長的需求。隨著從臺式機到數(shù)據(jù)中心的工作負(fù)載愈發(fā)龐大、愈發(fā)復(fù)雜、愈發(fā)多樣,英特爾在架構(gòu)日上展示的突破展現(xiàn)了架構(gòu)將如何滿足對更高計算性能的需求。
Raja Koduri強調(diào)了架構(gòu)提升對于滿足這一需求的重要性:“架構(gòu)是硬件和軟件的‘煉金術(shù)’。它將特定計算引擎所需的先進的晶體管結(jié)合在一起,通過領(lǐng)先的封裝技術(shù)將它們連接,集成高帶寬和低功耗緩存,并在封裝中為混合計算集群配備高容量、高帶寬內(nèi)存和低時延、可擴展互連,同時確保所有軟件無縫加速。隨著桌面到數(shù)據(jù)中心的工作負(fù)載變得前所未有的密集、復(fù)雜、且多樣,今年公布的這些新突破也展示了架構(gòu)將如何滿足對于更高計算性能的迫切需求。”
英特爾在活動上介紹了在x86架構(gòu)上的兩大創(chuàng)新:能效核和性能核
x86內(nèi)核
能效核
全新的英特爾能效核微架構(gòu),曾用代號“Gracemont”,旨在面對當(dāng)今多任務(wù)場景,提高吞吐量效率并提供可擴展多線程性能。此高能效x86微架構(gòu)在有限的硅片空間實現(xiàn)多核任務(wù)負(fù)載,并具備寬泛的頻率范圍。該架構(gòu)致力通過低電壓能效核降低整體功率消耗,為更高頻率運行提供功率熱空間。這也讓能效核提升性能,以滿足更多動態(tài)任務(wù)負(fù)載。
這個高度可擴展的x86微架構(gòu),它能滿足客戶從低功耗移動應(yīng)用到多核微服務(wù)的全方位計算需求。對比英特爾迄今為止最多產(chǎn)的CPU微架構(gòu)——Skylake,能效核可在相同功耗下提升40%的單線程性能,或者在提供同樣性能時,功耗僅為Skylake的40%不到。1就吞吐量性能而言,與運行四個線程的兩個Skylake內(nèi)核相比,四個能效核在性能提升80%的同時功耗更低,或者在提供相同吞吐量性能時,功耗降低80%。
能效核可以利用各種技術(shù)進步,在不耗費處理器功率的情況下對工作負(fù)載進行優(yōu)先級排序,并通過每周期指令數(shù)(IPC)改進功能直接提高性能,這些功能包括:
· 擁有5000個條目的分支目標(biāo)緩存區(qū),實現(xiàn)更準(zhǔn)確的分支預(yù)測
· 64KB指令緩存,在不耗費內(nèi)存子系統(tǒng)功率的情況下保存可用指令
· 英特爾的首款按需指令長度解碼器,可生成預(yù)解碼信息
· 英特爾的簇亂序執(zhí)行解碼器,可在保持能效的同時,每周期解碼多達6條指令
· 后端寬度(Wide Back End)具備5組寬度分配(Five-wide allocation)和8組寬度引退、256個亂序窗口入口和17個執(zhí)行端口
· 支持英特爾®控制流強制技術(shù)和英特爾®虛擬化技術(shù)重定向保護等功能
· 實現(xiàn)了AVX指令集以及支持整數(shù)人工智能操作的新擴展
性能核
英特爾全新性能核微架構(gòu),曾用代號 “Golden Cove”, 旨在提高速度,突破低時延和單線程應(yīng)用程序性能的限制。工作負(fù)載的代碼體積正在不斷增長,需要更強的執(zhí)行能力。數(shù)據(jù)集也隨著數(shù)據(jù)帶寬的需求提升而大幅增加。英特爾全新性能核微架構(gòu)帶來了顯著增速同時更好地支持代碼體積較大的應(yīng)用程序。
它展現(xiàn)出更高的并行性,提高執(zhí)行并行性,降低時延,提升通用性能。它還幫助支持大數(shù)據(jù)集和大型代碼體積的應(yīng)用程序。與第11代酷睿架構(gòu)(Cypress Cove內(nèi)核)相比,相同頻率下,性能核在一系列工作負(fù)載上平均提升了約19%。
性能核擁有更寬、更深、更智能的架構(gòu):
· 更寬:解碼器由4個增至6個,6µop 緩存增至8µop,分配由5路增至6路,執(zhí)行端口由10個增至12個
· 更深:更大的物理寄存器文件(physical register files),擁有512條目的重排序緩沖區(qū)
· 更智能:提高了分支預(yù)測準(zhǔn)確度,降低了有效的一級時延,優(yōu)化了二級的全寫入預(yù)測帶寬
性能核是英特爾迄今為止性能最高的CPU內(nèi)核,而且在CPU架構(gòu)性能方面實現(xiàn)階梯式提升,推動未來十年的計算發(fā)展,其通過以下功能突破了低時延和單線程應(yīng)用程序性能的極限:
· 相比目前的第11代英特爾® 酷睿™ 處理器架構(gòu)(Cypress Cove),在通用性能的ISO頻率下,針對大范圍的工作負(fù)載實現(xiàn)了平均約19%的改進1
· 呈現(xiàn)出更高的并行性和執(zhí)行并行性的增加
· 搭載英特爾®高級矩形擴展(AMX),內(nèi)置下一代AI加速提升技術(shù),用于學(xué)習(xí)推理和訓(xùn)練。AMX包括專用硬件和新指令集架構(gòu),以明顯提高矩陣乘法運算
· 減少時延,對大型數(shù)據(jù)和代碼體積較大的應(yīng)用程序提供更好的支持
回望過去一年,科技處于所有人如何溝通、工作、娛樂和應(yīng)對新冠肺炎疫情的核心。事實證明,強大的計算能力至關(guān)重要。展望未來,我們面臨龐大的算力需求,預(yù)計到2025年將是1000x(千倍級)的提升,而四年內(nèi)增加1,000倍相當(dāng)于摩爾定律的5次方。
英特爾CEO帕特·基辛格也是一位架構(gòu)師,他說:“我們面臨艱巨的計算挑戰(zhàn),一定要通過變革性的架構(gòu)和平臺來解決……正是英特爾才華橫溢的架構(gòu)師和工程師們,讓這些技術(shù)‘魔法’得以成真。”
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...