人工智能快速迭代,大模型時期僅依靠算力堆疊已無法實現(xiàn)模型性能的同步線性提升,模型算法與底層硬件、軟件棧、開發(fā)框架間的協(xié)同效果最終影響其訓(xùn)推效率與性能表現(xiàn),人工智能軟硬件生態(tài)重要性凸顯。中國信息通信研究院人工智能研究所軟硬件與創(chuàng)新生態(tài)部主任李論分享了人工智能軟硬件產(chǎn)品創(chuàng)新及生態(tài)構(gòu)建的幾點思考,助力我國盡快構(gòu)建起技術(shù)領(lǐng)先、良性發(fā)展的軟硬件生態(tài)體系。
一、大模型的創(chuàng)新迭代與軟硬件系統(tǒng)深度耦合
大模型的升級迭代需要在龐大的軟硬件系統(tǒng)上進行實驗。模型的原始創(chuàng)新和應(yīng)用迭代落地已非常依賴先進的軟硬件協(xié)同技術(shù)生態(tài)體系,框架、芯片、集群、網(wǎng)絡(luò)等與算法間的協(xié)同愈發(fā)緊密。當(dāng)前以DeepSeek為代表的模型憑借工程化創(chuàng)新,實現(xiàn)性能的大幅度提升。特別是通過模型架構(gòu)、硬件算力和互聯(lián)通信等方面的極致優(yōu)化和協(xié)同來提升訓(xùn)練和推理的效能。從全球范圍看,Meta、字節(jié)等國內(nèi)外頭部企業(yè)也均在加快更大規(guī)模集群的軟硬件協(xié)同優(yōu)化,如創(chuàng)新集群網(wǎng)絡(luò)架構(gòu)、構(gòu)建先進的運維工具、優(yōu)化分布式并行策略等。我們預(yù)計,在下個階段,軟硬件協(xié)同和生態(tài)體系的構(gòu)建會是全球大模型創(chuàng)新和算力設(shè)施建設(shè)的競爭焦點。
二、我國在軟硬件協(xié)同和適配方面發(fā)展現(xiàn)狀
模型和底層硬件的適配是硬件能力能否充分釋放的關(guān)鍵。以業(yè)界典型的開源大模型DeepSeek為例,目前在國內(nèi)主流廠商的軟硬件產(chǎn)品上運行DeepSeek模型,仍然需要結(jié)合實際應(yīng)用場景進行深度優(yōu)化,從而滿足精度、性能以及產(chǎn)品服務(wù)等延伸需求。
我們把軟硬件適配分為三個階段,第一階段是完成軟硬件產(chǎn)品的基礎(chǔ)適配,保障模型在軟硬件系統(tǒng)上運行無報錯,達到“基本可用”狀態(tài)。第二階段是完成系統(tǒng)性能調(diào)優(yōu),如精度對齊,提升吞吐、延遲等指標(biāo)表現(xiàn),初步達到“好用”狀態(tài)。第三階段是和實際的場景結(jié)合,通過用戶、業(yè)務(wù)提供商、供應(yīng)商等多方協(xié)作,進一步提升落地應(yīng)用效果。
在此背景下,中國信通院通過構(gòu)建人工智能軟硬件基準體系A(chǔ)ISHPerf,推動國產(chǎn)化適配測試工作。我們發(fā)現(xiàn)大量國產(chǎn)軟硬件系統(tǒng)已能支持DeepSeek運行,通過一系列的優(yōu)化,能夠在數(shù)天內(nèi)實現(xiàn)“可用”,且部分廠商模型適配效果已與官方技術(shù)報告實現(xiàn)精度對齊,同時,短期內(nèi)出現(xiàn)多種工具包及一體機、公有云服務(wù)等產(chǎn)品形態(tài),模型易用性不斷提升。
三、人工智能算力設(shè)施及軟硬件產(chǎn)品發(fā)展路徑
從整體發(fā)展來看,我們認為規(guī)模定律在未來幾年仍將延續(xù)。業(yè)界主要有兩種發(fā)展思路:一是擴大訓(xùn)練算力規(guī)模,增加模型尺寸,提升模型精度。二是聚焦參數(shù)一定范圍內(nèi)的模型改造與高效訓(xùn)練,特別在計算受限下,通過模型參數(shù)與訓(xùn)練數(shù)據(jù)有效配比和算法架構(gòu)改造提升訓(xùn)練效能,是廠商技術(shù)比拼的關(guān)鍵。
在這樣的發(fā)展路徑下,有三個創(chuàng)新重點:一是聚焦系統(tǒng)性能、提升算力利用率。算力需求雖仍在大幅度增長,但當(dāng)前大量集群的算力利用率仍不足50%,需要進行計算、存儲、通信的軟硬件深度協(xié)同,來實現(xiàn)系統(tǒng)性能提升。二是聚焦推理優(yōu)化方面的創(chuàng)新。大模型推理成為落地應(yīng)用的關(guān)鍵環(huán)節(jié),通過硬件、軟件一體化集成,及分布式并行推理等技術(shù)能有效提升推理效率,出現(xiàn)一體機、推理集群等新的產(chǎn)品服務(wù)形式。三是面向多樣場景的適配是落地關(guān)鍵。DeepSeek等開源模型生態(tài)有望進一步促進行業(yè)應(yīng)用需求增長,但各個場景性能指標(biāo)存在差異,存在大量點對點適配問題,需深度適配優(yōu)化。
四、我國需面向應(yīng)用需求持續(xù)推動軟硬件產(chǎn)品創(chuàng)新和生態(tài)建設(shè)
應(yīng)用模型的高效部署和生態(tài)協(xié)同范式的建立是下階段AI產(chǎn)品的創(chuàng)新關(guān)鍵。為了進一步凝聚產(chǎn)業(yè)共識,降低軟硬件選型技術(shù)難度和開發(fā)門檻,依托工信部人工智能標(biāo)準化技術(shù)委員會,中國信通院基于人工智能軟硬件基準AISHPerf工作組已推進十余項標(biāo)準制定工作,覆蓋算子、計算設(shè)備、訓(xùn)推集群、框架工具、邊端系統(tǒng)、智算的互聯(lián)、網(wǎng)絡(luò)等領(lǐng)域。此外,我們在北京亦莊建設(shè)了首個人工智能軟硬件協(xié)同創(chuàng)新與適配驗證中心,面向包括芯片、服務(wù)器、不同類型的計算設(shè)備、集群、開發(fā)框架及平臺、一體機等在內(nèi)的人工智能軟硬件產(chǎn)品,去提供相應(yīng)的實驗驗證、測試和產(chǎn)業(yè)培育等工作。下一步,我們將持續(xù)開展大模型軟硬一體設(shè)備、框架軟件與工具、大規(guī)模智算集群等系列測試驗證工作,舉辦“興智杯”全國人工智能創(chuàng)新應(yīng)用大賽、大模型創(chuàng)新發(fā)展與軟硬件協(xié)同生態(tài)論壇等大型賽會活動,希望能夠有序引導(dǎo)人工智能模型和軟硬件廠商間的協(xié)同創(chuàng)新,集聚各方力量盡快構(gòu)建起技術(shù)領(lǐng)先、良性發(fā)展的產(chǎn)業(yè)生態(tài)體系。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...