導(dǎo)語(yǔ)
在人工智能推理日益走向邊緣計(jì)算的浪潮中,Imagination推出全新E系列(E-Series)GPU IP,以革命性的“AI+圖形”深度融合架構(gòu),回應(yīng)邊緣側(cè)對(duì)低功耗、高靈活性與強(qiáng)算力的多重需求。通過(guò)架構(gòu)創(chuàng)新、算力擴(kuò)展、功耗優(yōu)化以及軟件生態(tài)配套,E系列試圖重新定義“邊緣AI計(jì)算”的邊界,并提供一條兼顧靈活性與高效性的技術(shù)路徑。
邊緣AI進(jìn)入加速期,GPU迎來(lái)轉(zhuǎn)型窗口
當(dāng)前邊緣側(cè)AI推理正以前所未有的速度增長(zhǎng)。從市場(chǎng)應(yīng)用端來(lái)看,自動(dòng)駕駛、智能手機(jī)、工廠設(shè)備、甚至消費(fèi)級(jí)機(jī)器人,都在逐步脫離云端,開(kāi)始在本地完成圖像識(shí)別、路徑規(guī)劃、語(yǔ)音交互等智能化任務(wù)。
Imagination中國(guó)區(qū)技術(shù)總監(jiān)艾克指出,邊緣AI需求的爆發(fā)源于多重因素:一是隱私敏感數(shù)據(jù)(如健康數(shù)據(jù)或企業(yè)數(shù)據(jù))無(wú)法上云;二是實(shí)時(shí)性要求(如輔助駕駛的瞬時(shí)響應(yīng));三是邊緣設(shè)備的資源限制(如功耗和算力)。據(jù)統(tǒng)計(jì),Hugging Face上AI模型下載量從2023年的70萬(wàn)激增至2025年的700萬(wàn),反映了邊緣側(cè)模型部署的幾何級(jí)增長(zhǎng)。同時(shí),AI算法從卷積神經(jīng)網(wǎng)絡(luò)(CNN)到Transformer,再到圖生視頻等復(fù)雜多模態(tài)模型的快速迭代,對(duì)硬件的靈活性和并行計(jì)算能力提出了更高要求。
圖源:Imagination(下同)
傳統(tǒng)處理器架構(gòu)在應(yīng)對(duì)邊緣AI時(shí)各有優(yōu)劣:CPU靈活,但處理并行任務(wù)吃力;NPU強(qiáng)大,卻在應(yīng)對(duì)新模型、新算子時(shí)捉襟見(jiàn)肘;GPU,特別是可編程的通用GPU,恰好介于兩者之間。但傳統(tǒng)GPU并非為AI推理而生,其架構(gòu)仍有諸多優(yōu)化空間。在當(dāng)前AI工作負(fù)載逐年變化的情況下,AI硬件系統(tǒng)仍需要一定程度的靈活性和通用加速能力,以確保設(shè)備的未來(lái)適用性。而Imagination的E系列GPU IP正是在這個(gè)夾縫中開(kāi)辟了一條新路。
E系列:GPU設(shè)計(jì)的范式轉(zhuǎn)變
架構(gòu)革新:圖形與AI的深度融合
E系列GPU是Imagination產(chǎn)品線的一次重大飛躍,其最 大的亮點(diǎn),在于其對(duì)“AI+圖形”融合的系統(tǒng)性重構(gòu)。
據(jù)Imagination中國(guó)區(qū)技術(shù)總監(jiān)艾克的介紹,Imagination多年來(lái)在圖形處理上積累的大量技術(shù),例如分塊延遲渲染技術(shù)(TBDR)、壓縮緩沖等技術(shù),天然具備低功耗、高利用率的特點(diǎn)。當(dāng)這些架構(gòu)被用來(lái)服務(wù)AI推理時(shí),展現(xiàn)出強(qiáng)大的性能密度優(yōu)勢(shì)。E-Series 將AI加速能力“原生”嵌入GPU體系,讓GPU從圖形引擎演進(jìn)為通用AI處理核心。
眾所周知,Imagination的PowerVR GPU架構(gòu)以能效著稱(chēng),已在功耗受限設(shè)備中應(yīng)用近二十年。然而,在硬件功耗與面積控制方面,E系列在相同工藝節(jié)點(diǎn)下比前一代D系列實(shí)現(xiàn)了35%的平均能效提升。其背后關(guān)鍵就在于,E-Series引入的全新爆發(fā)式處理器(Burst Processors)技術(shù),得益于指令調(diào)度路徑壓縮、本地寄存器(每個(gè)計(jì)算單元配備近 0.5MB 寄存空間)的復(fù)用機(jī)制、矩陣乘法運(yùn)算單元的集成優(yōu)化等架構(gòu)升級(jí)。與傳統(tǒng)NPU相比,E系列無(wú)需回退至CPU處理“未知算子”,極大提升了系統(tǒng)穩(wěn)定性和靈活性。
與NPU相比,E 系列的優(yōu)勢(shì)不僅體現(xiàn)在可編程性與靈活性上,還在于其面向未來(lái)模型演進(jìn)的架構(gòu)適應(yīng)能力。當(dāng)前市面上的AI解決方案多采用GPU與NPU物理隔離的架構(gòu),在數(shù)據(jù)交互、功耗效率和系統(tǒng)成本方面均存在短板。而E系列則實(shí)現(xiàn)了AI計(jì)算單元與GPU圖形管線的深度集成:AI算力核心與GPU USC(統(tǒng)一渲染集群)共享寄存器、緩存與調(diào)度機(jī)制,打破了以往“各自為政”的瓶頸,推動(dòng)圖形與AI的真正協(xié)同。
這種設(shè)計(jì)不僅提高了資源利用率,更帶來(lái)了數(shù)據(jù)路徑的顯著壓縮,有效降低了推理延遲,尤其適合圖形增強(qiáng)類(lèi)AI場(chǎng)景:如圖像超分辨率、場(chǎng)景理解、光照遮蔽計(jì)算、景深識(shí)別等。它還兼容Vulkan、OpenCL等主流計(jì)算接口,編程生態(tài)友好,具備廣泛的開(kāi)發(fā)者支持基礎(chǔ)。
“很多 NPU 在設(shè)計(jì)時(shí)只能適配當(dāng)前主流模型(如CNN),一旦未來(lái)模型發(fā)生變化(例如 Transformer 或多模態(tài)網(wǎng)絡(luò)),現(xiàn)有NPU將無(wú)力支持,而 GPU 的編程靈活性則確保了其長(zhǎng)期適應(yīng)性。”這一點(diǎn)對(duì)于生命周期長(zhǎng)達(dá)十年以上的車(chē)規(guī)級(jí)芯片尤其重要。Imagination發(fā)言人指出。
算力飛躍:從輕量級(jí)到多模態(tài)的全場(chǎng)景覆蓋
在算力層面,E系列Neural Cores(神經(jīng)核)支持2TOPS至200TOPS的AI算力覆蓋,支持從輕量級(jí)終端到復(fù)雜多模態(tài)系統(tǒng)的全場(chǎng)景部署。4核1.6GHz配置下,圖形填充能力可達(dá)400Gpixels/s,F(xiàn)P32浮點(diǎn)運(yùn)算能力13TFLOPS,而INT8推理性能更是達(dá)到驚人的200TOPS。這種單位面積下的算力密度比前代提升了3.6倍,遠(yuǎn)超傳統(tǒng)GPU架構(gòu)的性能曲線。
同時(shí),E系列也支持包括FP32、BF16、FP8、MXFP4等多種AI主流格式,結(jié)合Imagination優(yōu)化的計(jì)算庫(kù)與圖優(yōu)化編譯器,開(kāi)發(fā)者可通過(guò)TVM等框架便捷地完成PyTorch、TensorFlow等主流模型的部署與適配。
靈活擴(kuò)展與多任務(wù)并行
在任務(wù)調(diào)度層面,E系列支持多達(dá)16個(gè)虛擬機(jī)實(shí)例的運(yùn)行隔離,且可通過(guò)我們的硬件虛擬化實(shí)現(xiàn)AI、圖形、UI等多任務(wù)的異步并行處理。其在Cockpit域、娛樂(lè)域、駕駛輔助域等多種車(chē)載場(chǎng)景中已展現(xiàn)出良好的適配能力。例如,在智能座艙中,E系列可同時(shí)承擔(dān)儀表渲染與人機(jī)交互AI任務(wù);在駕駛域內(nèi)則實(shí)現(xiàn)對(duì)駕駛員狀態(tài)的AI監(jiān)控及語(yǔ)音交互響應(yīng)。
此外,E系列支持從單核0.25T FP32輕量部署至多核200T強(qiáng)算力橫向擴(kuò)展,具備覆蓋移動(dòng)設(shè)備、工業(yè)終端、AI PC乃至邊緣數(shù)據(jù)中心的彈性能力,為SoC廠商提供從單芯片集成到異構(gòu)協(xié)同的多元路徑選擇。
生態(tài)完備,打通從模型到芯片的部署閉環(huán)
軟硬件協(xié)同是邊緣AI落地的關(guān)鍵一環(huán)。Imagination為E系列配套構(gòu)建了完整的軟件棧支持:包括數(shù)學(xué)計(jì)算庫(kù)、FFT、Kernel優(yōu)化、TVM適配、Graph Compiler、TensorRT Lite推理鏈,以及多操作系統(tǒng)、編譯器工具與調(diào)試套件。開(kāi)發(fā)者不僅能完成離線模型部署,還能實(shí)現(xiàn)輕量級(jí)應(yīng)用的在線部署及推理推送,從而支持包括自動(dòng)駕駛、移動(dòng)設(shè)備、工業(yè)終端等在內(nèi)的多種邊緣場(chǎng)景的動(dòng)態(tài)智能需求。
值得一提的是,Imagination在RISC-V生態(tài)中也扮演著關(guān)鍵角色。憑借其卓 越的圖形與AI能力,已與多家RISC-V平臺(tái)客戶(hù)進(jìn)行集成驗(yàn)證,并將持續(xù)推動(dòng)開(kāi)源硬件與高效算力在邊緣智能中的協(xié)同演進(jìn)。
從實(shí)際落地來(lái)看,Imagination已為E系列規(guī)劃了多個(gè)子系列產(chǎn)品,分別面向功能安全需求的汽車(chē)域控(EXS)、消費(fèi)電子(EXT)、以及AI PC等高性能領(lǐng)域(EXD)。我們可與客戶(hù)協(xié)作開(kāi)發(fā)配置方案,以適應(yīng)從輕量級(jí)設(shè)備到復(fù)雜多模態(tài)系統(tǒng)的廣泛需求。在Imagination看來(lái),在AI模型迭代迅速、多模態(tài)計(jì)算需求上升的趨勢(shì)下,GPU以其靈活可編程的特性,展現(xiàn)出相較NPU更優(yōu)的可拓展性與生命周期優(yōu)勢(shì),尤其適用于未來(lái)十年仍需持續(xù)升級(jí)的車(chē)載平臺(tái)。
首 款E-Series GPU IP將于2025年秋季正式上市,目前已完成授權(quán)。汽車(chē)、消費(fèi)電子、桌面及移動(dòng)版本亦在同步開(kāi)發(fā)中。隨著正式發(fā)布日期臨近,該系列產(chǎn)品有望在中國(guó)市場(chǎng)掀起一輪邊緣算力升級(jí)的新熱潮。Imagination 公司中國(guó)區(qū)董事長(zhǎng)兼亞太總裁白農(nóng)強(qiáng)調(diào),中國(guó)是Imagination全球最重要的戰(zhàn)略市場(chǎng)之一,公司將持續(xù)加大本地化投入,深化與本土生態(tài)的合作。
寫(xiě)在最后
E系列GPU IP是Imagination技術(shù)積淀的里程碑,不僅在性能、功耗和芯片面積上實(shí)現(xiàn)突破,更通過(guò)架構(gòu)創(chuàng)新,從傳統(tǒng)圖形渲染邁向通用AI計(jì)算。面對(duì)邊緣AI應(yīng)用的爆發(fā)式增長(zhǎng),尤其在輕量大模型(如DeepSeek)快速發(fā)展的背景下,E系列以圖形渲染與AI推理的統(tǒng)一計(jì)算平臺(tái),為客戶(hù)提供更高靈活性與競(jìng)爭(zhēng)力。
AI的未來(lái),在云,更在邊。Imagination E系列代表著GPU與AI融合的一次范式躍遷,不僅在性能與功耗之間找到了新的平衡,更通過(guò)深度集成與軟硬件協(xié)同,為邊緣智能提供了一種更具擴(kuò)展性、靈活性與經(jīng)濟(jì)性的技術(shù)解法。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...