端側(cè)AI可能帶來的算力閑置
端側(cè)AI的性能雖然弱于云側(cè)AI,但更貼近用戶使用場景,低延時(shí)、高可靠性、低成本、隱私和安全等優(yōu)勢顯著,更有機(jī)會獲得用戶的認(rèn)同和使用。隨著今年端側(cè)AI的爆發(fā),端側(cè)的硬件性能得到了大幅提升。
安迪-比爾定理 (Andy and Bill’s Law)是對IT產(chǎn)業(yè)中軟件和硬件升級換代關(guān)系的一個(gè)概括。“Andy gives, Bill takes away.(安迪提供什么,比爾拿走什么。)” 安迪指英特爾前CEO安迪·格魯夫,比爾指微軟前任CEO比爾·蓋茨,意思是硬件提高的性能,很快被軟件消耗掉了。
但是,AI終端(手機(jī)、電腦)的AI功能(如文本生成、多模態(tài)音視頻處理等),目前從場景和使用頻率來看,遠(yuǎn)不及手機(jī)、電腦傳統(tǒng)的各類功能應(yīng)用,端側(cè)智能體的生態(tài)也尚未形成,當(dāng)云側(cè)大模型還在拿著錘子找釘子,滿世界尋找應(yīng)用場景的時(shí)候,端側(cè)AI又開始搶奪需求,AI的供求失衡很可能出現(xiàn),導(dǎo)致一定時(shí)期內(nèi)端側(cè)AI的硬件設(shè)備處于閑置狀態(tài)。
端側(cè)AI的邊緣算力有多大
以手機(jī)為例,根據(jù)中國電信研究院2023年“終端智能算力發(fā)展指數(shù)”報(bào)告,截至2023年2月,國內(nèi)存量手機(jī)終端智能算力總規(guī)模超7100EOPS,是我國數(shù)據(jù)中心算力總規(guī)模12倍以上。據(jù)2024年5月Counterpoint&和聯(lián)發(fā)科發(fā)布的《生成式AI手機(jī)產(chǎn)業(yè)白皮書 》,預(yù)計(jì)在 2027 年AI手機(jī)將會AI手機(jī)的存量規(guī)模將會從 2023 年的只有百萬級別增長至 2027 年的 12.3 億部, AI手機(jī)端側(cè)整體 AI算力將會達(dá)到 50000EOPS以上,未來AI 手機(jī)將會成為不可忽視的 AI計(jì)算資源池。
根據(jù)App Annie發(fā)布的《2022年移動狀態(tài)報(bào)告》,2021年全球移動設(shè)備使用量為3.8萬億小時(shí),平均每天使用3.3小時(shí)。QuestMobile 2023中國互聯(lián)網(wǎng)核心趨勢年度報(bào)告顯示,12.24億用戶每月上網(wǎng)160小時(shí) 。由此可見,從用戶使用習(xí)慣來看,智能手機(jī)除了正常每天3-5小時(shí)的使用,其余大部分時(shí)間處于充電、休眠等開機(jī)狀態(tài)。在多數(shù)時(shí)間里,AI算力都處于閑置狀態(tài)。
再來看看AI PC,微軟將最低內(nèi)存配置16GB,至少40 TOPS以上計(jì)算能力的電腦定義為AI PC。Canalys預(yù)測到2027年AI PC全球出貨量預(yù)計(jì)超過1.7億臺,在總個(gè)人電腦出貨量的占比超60%,23-27年AI PC出貨量 CAGR達(dá)63%。按此計(jì)算,AI PC 2027年一年的出貨量就能新增端側(cè)算力至少68億TOPS。 AIPC用戶在不使用時(shí),可能處于關(guān)機(jī)/待機(jī)狀態(tài),但只要有足夠的動力驅(qū)動,其算力完全可能得到共享利用。
利用AI端側(cè)算力的技術(shù)可行性
在端側(cè)算力的利用上,目前主要有六大關(guān)鍵技術(shù),包括層次化端算力感知圖模型、面向多終端協(xié)同的資源虛擬化技術(shù)、多終端協(xié)同的數(shù)據(jù)壓縮技術(shù)、多粒度多層次端算力調(diào)度、面向終端設(shè)備的現(xiàn)場級 AI 推理以及端算力的定價(jià)機(jī)制。
層次化端側(cè)算力感知圖模型,試圖構(gòu)建終端設(shè)備的算力特征向量(A=[計(jì)算資源剩余量,存儲資源剩余量,電池剩余量,通信能力,數(shù)據(jù)感知能力,移動模式,微服務(wù)匹配度,隱私保護(hù)度]),并根據(jù)特征向量評估終端設(shè)備的綜合算力值。端側(cè)設(shè)備能夠憑借其智能體實(shí)時(shí)感知的能力,計(jì)算特征向量,評估自身的綜合算力值,并提供給需求者。
面向多終端協(xié)同的資源虛擬化技術(shù),在邊緣計(jì)算環(huán)境中,海量的端側(cè)設(shè)備與包含 CPU、GPU、FPGA、TPU 等不同計(jì)算架構(gòu)的邊緣計(jì)算基礎(chǔ)設(shè)施共同構(gòu)成了極度異構(gòu)的計(jì)算環(huán)境。信通院在《邊緣算力白皮書》2022》中指出,為了實(shí)現(xiàn)不同計(jì)算硬件的統(tǒng)一調(diào)度,業(yè)界從兩個(gè)方向開展技術(shù)研究與實(shí)現(xiàn),以云廠商為代表的邊緣計(jì)算服務(wù)商,通過虛擬化技術(shù)將計(jì)算資源池化,向用戶提供算力資源服務(wù);邊緣計(jì)算硬件廠商,基于自身硬件產(chǎn)品,提出統(tǒng)一的編程模型,為跨 CPU、GPU、FPGA、專用加速器的開發(fā)者提供統(tǒng)一的體驗(yàn)。隨著端側(cè)算力的爆發(fā),云廠商會加快做好前者,而端側(cè)設(shè)備的廠商,完全有能力也有動力做好后者。
多終端協(xié)同的數(shù)據(jù)壓縮技術(shù),端側(cè)設(shè)備能夠借助自身大模型的非線性映射能力,快速學(xué)習(xí)到海量數(shù)據(jù)(如視頻、圖片)的深層次特征,更加有效地去除掉冗余數(shù)據(jù)特征,滿足海量數(shù)據(jù)壓縮的需求,實(shí)現(xiàn)端側(cè)海量數(shù)據(jù)的低時(shí)延傳輸。
多粒度多層次端算力調(diào)度有兩方面的工作,一是任務(wù)的解構(gòu),大型任務(wù)無法在單個(gè)終端上承載,需要將其根據(jù)業(yè)務(wù)邏輯,資源需求,性能需求,服務(wù)持續(xù)性,業(yè)務(wù)流粘性,資源節(jié)點(diǎn)統(tǒng)一性等因素,分解成小粒度,簡化的算力需求,使業(yè)務(wù)可以分布式地部署在多個(gè)終端算力節(jié)點(diǎn)上。二是多層次的算力調(diào)度,包括端側(cè)算力網(wǎng)絡(luò)內(nèi)部的多層次調(diào)度和云邊端協(xié)同的多層次調(diào)度。這兩點(diǎn)可以通過端側(cè)AI和云側(cè)AI的協(xié)同來實(shí)現(xiàn)。
面向終端設(shè)備的現(xiàn)場級 AI 推理,實(shí)際上就是要求在端側(cè)部署大模型,端側(cè)設(shè)備具有的高算力芯片和部署的大模型,能夠輕而易舉地實(shí)現(xiàn)這一關(guān)鍵技術(shù)。
端側(cè)算力定價(jià)機(jī)制是共享端側(cè)算力的基礎(chǔ),在《端側(cè)算力網(wǎng)絡(luò)白皮書(2022年)》中提出了區(qū)塊鏈工作量證明和基于拍賣算法的定價(jià)策略。前者可以構(gòu)建一個(gè)端側(cè)算力的區(qū)塊鏈,端側(cè)設(shè)備通過工作量證明機(jī)制獲得一定的token獎勵(lì),后者可以通過端側(cè)設(shè)備的AI AGENT,對算力進(jìn)行議價(jià),實(shí)現(xiàn)算力的共享。
端側(cè)AI算力對電信運(yùn)營商的意義
1.緩解云側(cè)AI算力消耗,降低數(shù)據(jù)中心能耗
端側(cè)設(shè)備是通過電信網(wǎng)絡(luò)接入通信網(wǎng)和互聯(lián)網(wǎng),因此,運(yùn)營商可以考慮通過虛擬化技術(shù)將計(jì)算資源池化,將端側(cè)的算力納入其算力板塊,成為運(yùn)營商算力的重要組成,通過有效運(yùn)營帶來增量收入,如果運(yùn)營商不思考如何利用這一算力,很有可能被其它云廠商搶占。
數(shù)據(jù)中心是耗能大戶。據(jù)統(tǒng)計(jì),數(shù)據(jù)中心每年消耗的電力約占全球總發(fā)電量的2%。其中,AI計(jì)算是數(shù)據(jù)中心的主要耗能來源之一。端側(cè)設(shè)備可以幫助企業(yè)降低數(shù)據(jù)中心的能耗。當(dāng)AI任務(wù)在端側(cè)設(shè)備上完成時(shí),就不需要將數(shù)據(jù)傳輸?shù)皆贫诉M(jìn)行處理,從而可以節(jié)省大量的能源,有效降低數(shù)據(jù)中心的能耗,減少碳排放。
2.與用戶實(shí)現(xiàn)共贏
用戶將閑置算力共享出去,可以提高終端的利用率,發(fā)揮更大價(jià)值。從而獲得額外的收入。這可以降低部分終端的購買和使用成本。用戶通過出租閑置算力獲得報(bào)酬,報(bào)酬的多少取決于閑置算力的數(shù)量和質(zhì)量。例如,如果用戶的終端配備了更高性能的AI芯片,那么他可以獲得更高的報(bào)酬。
運(yùn)營商可以通過平臺將來自多個(gè)用戶的閑置算力聚合在一起,形成一個(gè)巨大的算力資源池。提供給需要AI計(jì)算能力的企業(yè)和機(jī)構(gòu)。還可以利用其閑置算力來完成一些計(jì)算密集型的任務(wù)。
例如Folding@home項(xiàng)目,是一個(gè)研究蛋白質(zhì)折疊、誤折、聚合及由此引起的相關(guān)疾病的分布式計(jì)算工程,由斯坦福大學(xué)化學(xué)系的潘德小組( Pande Group )主持,于 2000 年 10 月 1 日正式啟動, Folding@home是目前世界上最大的分布式計(jì)算項(xiàng)目。截止目前有超過百萬人參與項(xiàng)目,它的計(jì)算能力總能達(dá)到全球超級計(jì)算機(jī) TOP 10 水平。新冠流行期間,F(xiàn)olding@home 向全球發(fā)出號召,希望更多人能貢獻(xiàn)自己的閑置算力幫助其尋找新冠肺炎的突破口。
表1 邊緣算力的貢獻(xiàn)(數(shù)據(jù)來源:Folding@home官網(wǎng))
還有其它一些邊緣算力共享的例子,如Einstein@Home項(xiàng)目基于BOINC平臺,利用志愿計(jì)算的威力來處理分析LIGO和GEO600采集的海量觀測數(shù)據(jù),以從中尋找引力波存在的證據(jù)。CPDN項(xiàng)目嘗試預(yù)測21世紀(jì)氣候等等。
3.風(fēng)險(xiǎn)與挑戰(zhàn)
端側(cè)AI作為邊緣計(jì)算中的新成員,正在逐漸展現(xiàn)出其巨大的潛力。隨著技術(shù)的進(jìn)步和應(yīng)用場景的拓展,端側(cè)AI的算力資源有望被更廣泛地共享,實(shí)現(xiàn)資源的優(yōu)化配置和高效利用。
端側(cè)AI算力共享依賴于用戶對共享的利益和風(fēng)險(xiǎn)的充分理解。用戶是否愿意分享其設(shè)備算力,很大程度上取決于他們對共享可能帶來的經(jīng)濟(jì)激勵(lì)和服務(wù)優(yōu)化等實(shí)際好處的認(rèn)知,以及對數(shù)據(jù)安全和隱私保護(hù)的擔(dān)憂。因此,建立一個(gè)透明、可靠的共享機(jī)制,確保用戶數(shù)據(jù)的安全和隱私,是至關(guān)重要的。
共享算力的收益價(jià)值是影響用戶分享意愿的關(guān)鍵因素。用戶需要看到通過共享算力能夠獲得的實(shí)際利益,這可能包括經(jīng)濟(jì)補(bǔ)償、服務(wù)優(yōu)化或其他形式的回報(bào)。只有當(dāng)用戶認(rèn)為共享算力的收益明顯大于其潛在風(fēng)險(xiǎn)時(shí),他們才更有可能積極參與。
隱私保護(hù)是端側(cè)AI算力共享中不可忽視的問題。必須采取有效的技術(shù)措施和管理策略來保護(hù)用戶的隱私,如數(shù)據(jù)加密、匿名化處理和訪問控制等,以確保用戶數(shù)據(jù)在共享過程中不被濫用或泄露。
端側(cè)AI算力的管理平臺同樣面臨著成本和持續(xù)經(jīng)營能力的挑戰(zhàn)。平臺需要投入資源進(jìn)行技術(shù)研發(fā)、維護(hù)運(yùn)營和市場推廣,同時(shí)也需要探索可持續(xù)的商業(yè)模式,以確保平臺的長期穩(wěn)定發(fā)展。
本文作者
劉敬東
戰(zhàn)略發(fā)展研究所
二級分析師
碩士,就職于中國電信研究院,長期從事電信新產(chǎn)品、客服服務(wù)、數(shù)字化轉(zhuǎn)型等領(lǐng)域的研究。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...