生成式AI之戰(zhàn)，誰(shuí)能破局而出？

2023/05/04 09:02 互聯(lián)網(wǎng)那些事小馬哥

　　隨著騰訊的入局，國(guó)內(nèi)生成式AI大模型賽道集齊BAT三大巨頭，競(jìng)爭(zhēng)日趨白熱化。

　　4月14日，騰訊云發(fā)布面向大模型訓(xùn)練的新一代高性能計(jì)算集群，搭載英偉達(dá)最新一代H800 GPU，服務(wù)器互聯(lián)帶寬高達(dá)3.2T，算力性能較上一代提升3倍，號(hào)稱目前國(guó)內(nèi)性能最強(qiáng)的大模型計(jì)算集群。

　　除了算力基礎(chǔ)設(shè)施，騰訊去年6月發(fā)布混元大模型，微信也在去年10月發(fā)布WeML大模型。在上月底的財(cái)報(bào)電話會(huì)議上，騰訊總裁劉熾平表示，對(duì)于騰訊整個(gè)業(yè)務(wù)來(lái)說(shuō)，AI及大模型是一個(gè)增長(zhǎng)的擴(kuò)大器。

　　在騰訊下場(chǎng)之前，百度、阿里和華為等公司已經(jīng)先后落子這一領(lǐng)域。

　　3月中旬，百度推出“文心一言”;半個(gè)多月后，華為在一場(chǎng)行業(yè)峰會(huì)上披露了“盤(pán)古”大模型的研發(fā)及落地情況;4月11日，阿里大模型“通義千問(wèn)”高調(diào)亮相，未來(lái)將接入阿里全線業(yè)務(wù)。

　　與此同時(shí)，360、網(wǎng)易、知乎、科大訊飛、昆侖萬(wàn)維等先后公布自己的大模型;此前淡出中心舞臺(tái)的王慧文和王小川重出江湖，迅速敲定數(shù)千萬(wàn)美元的融資，正在四處招兵買(mǎi)馬。

　　掀起新技術(shù)浪潮的AI大模型，已經(jīng)成為科技公司必須參加的一場(chǎng)大考。在AI領(lǐng)域深耕多年的商湯科技，也在本月交出自己的答卷。

　　入局AI大模型“馬拉松”

　　4月10日，商湯公布以“大模型+大算力”推進(jìn)AGI(通用人工智能)發(fā)展的戰(zhàn)略布局，并發(fā)布“日日新SenseNova”大模型體系，涵蓋自然語(yǔ)言處理、圖片視頻及3D內(nèi)容生成、自動(dòng)化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等多種大模型及能力。

　　其中，最引人關(guān)注的是“商量SenseChat”，一款千億級(jí)參數(shù)的自然語(yǔ)言處理大模型。在現(xiàn)場(chǎng)演示中，SenseChat能夠結(jié)合上下文語(yǔ)境，流暢準(zhǔn)確地回答各類問(wèn)題，還具備超長(zhǎng)文本理解能力，可以從復(fù)雜文檔中提取和概括信息，幫助開(kāi)發(fā)者編程，提供個(gè)性化的健康咨詢等。

　　此外，商湯還展示了多款基于大模型體系的生成式AI模型及應(yīng)用：“秒畫(huà)SenseMirage”AI內(nèi)容創(chuàng)作社區(qū)平臺(tái)可以根據(jù)文本生成圖片，擁有超10億參數(shù)，支持二次元、三次元等多種生成風(fēng)格，最高支持6K分辨率，還可支持自行上傳數(shù)據(jù)集進(jìn)行finetune、自訓(xùn)練等功能，定制訓(xùn)練屬于自己風(fēng)格的LoRA模型，顯著降低模型的訓(xùn)練門(mén)檻;“如影SenseAvatar”AI數(shù)字人視頻生成平臺(tái)僅需一段5分鐘的真人視頻素材，即可生成數(shù)字人分身;“瓊宇SenseSpace”和“格物SenseThings”3D內(nèi)容生成平臺(tái)能夠生成大模型3D場(chǎng)景和精細(xì)3D物件，為搭建元宇宙虛擬空間提供高效、低成本的工具。

　　秒畫(huà)SenseMirage可根據(jù)文本生成多種風(fēng)格的高清圖片

　　AI大模型是中國(guó)科技企業(yè)的又一塊兵家必爭(zhēng)之地。隨著B(niǎo)AT等互聯(lián)網(wǎng)公司，以及商湯、科大訊飛等AI老兵的入局，每個(gè)人都摩拳擦掌、躍躍欲試，準(zhǔn)備大干一場(chǎng)。

　　業(yè)內(nèi)人士普遍認(rèn)為，國(guó)產(chǎn)大模型與GPT至少有2~3年的差距。怎樣盡快趕上世界先進(jìn)水平，是擺在大大小小玩家面前的命題。將這一命題拆解開(kāi)來(lái)，最關(guān)鍵的是數(shù)據(jù)、算法和算力三大要素。

　　三要素中，算法的研發(fā)難度相對(duì)較低，且有眾多開(kāi)源項(xiàng)目可作為參考，中國(guó)公司最容易縮短甚至抹平差距;但在數(shù)據(jù)和算力方面，想要拉近與OpenAI的距離要困難得多。它需要更漫長(zhǎng)的積累沉淀，也需要企業(yè)持之以恒地拿出真金白銀，投入到AI相關(guān)的“硬科技”中。

　　這也意味著，大模型之爭(zhēng)不是一場(chǎng)停留在應(yīng)用層面的百米賽跑，而是一場(chǎng)由綜合能力定勝負(fù)的馬拉松。誰(shuí)能在數(shù)據(jù)和算力上建立壁壘，誰(shuí)就有望率先踏入生成式AI的新時(shí)代，在新技術(shù)浪潮中吃到更多紅利。

　　數(shù)據(jù)和算力，AI大模型兩大根基

　　ChatGPT之所以一鳴驚人、經(jīng)受住了上億用戶不同場(chǎng)景下的考驗(yàn)，首先得益于OpenAI給它“投喂”了大量數(shù)據(jù)。

　　OpenAI此前披露，為了AI像人類那樣流暢交談，研發(fā)人員給GPT-3.5提供多達(dá)45TB的文本語(yǔ)料，相當(dāng)于472萬(wàn)套中國(guó)“四大名著”。這些語(yǔ)料的來(lái)源包括維基百科、網(wǎng)絡(luò)文章、書(shū)籍期刊等，甚至還將代碼開(kāi)源平臺(tái)Github納入其中。

　　豐富而龐大的語(yǔ)料庫(kù)，讓ChatGPT不僅能夠聊天、講故事，還會(huì)回答專業(yè)問(wèn)題、幫學(xué)生寫(xiě)作業(yè)、給碼農(nóng)寫(xiě)代碼。在一些讀寫(xiě)測(cè)試中，ChatGPT展現(xiàn)出來(lái)的能力不亞于高中生。

　　與之類似，商湯語(yǔ)言大模型SenseChat也使用了大量數(shù)據(jù)進(jìn)行訓(xùn)練，并充分考慮中文語(yǔ)境，能夠更好地理解和處理中文文本。在發(fā)布會(huì)上，SenseChat一問(wèn)一答應(yīng)對(duì)自如，甚至還能夠根據(jù)《專利法》答疑解惑，結(jié)合法條和最新資訊給出合理答案。

　　可以看出，足夠多、足夠豐富的數(shù)據(jù)，是生成式AI大模型的根基。商湯在這方面有自己的獨(dú)特優(yōu)勢(shì)。

　　商湯的AI技術(shù)和產(chǎn)品已經(jīng)在眾多領(lǐng)域得到應(yīng)用，在長(zhǎng)期實(shí)踐中，商湯積累了大量真實(shí)世界的高質(zhì)量視覺(jué)數(shù)據(jù)，視覺(jué)信息可以轉(zhuǎn)化為更多結(jié)構(gòu)化的表達(dá)，形成豐富的多模態(tài)語(yǔ)料庫(kù)，為大模型研發(fā)奠定基礎(chǔ)。正如商湯董事長(zhǎng)兼CEO徐立所言，“商湯積累了大量視覺(jué)類信息，這類信息作為知識(shí)，輸入我們的多模態(tài)網(wǎng)絡(luò)中，會(huì)帶來(lái)完全不一樣的數(shù)據(jù)基礎(chǔ)。”不斷增長(zhǎng)的多模態(tài)數(shù)據(jù)池，讓商湯從源頭上建立了壁壘。

　　視覺(jué)大模型是商湯的核心技術(shù)突破點(diǎn)。早在2019年，商湯就發(fā)布了10億參數(shù)的視覺(jué)大模型，2022年擴(kuò)大至320億參數(shù)，為迄今為止全球*的視覺(jué)模型。而在自然語(yǔ)言處理、多模態(tài)和生成式AI大模型方面，商湯也已有產(chǎn)品落地。這些大模型的迭代生長(zhǎng)和融合匯聚，最終造就了商湯SenseNova大模型體系。

　　除了海量數(shù)據(jù)，大算力是大模型的另一個(gè)根基。

　　AI大模型所需要的計(jì)算量，大致上相當(dāng)于參數(shù)量與數(shù)據(jù)量的乘積。而大模型之所以“大”，就是因?yàn)閰?shù)眾多和數(shù)據(jù)量龐大。過(guò)去5年，AI大模型的參數(shù)量幾乎每年提升一個(gè)數(shù)量級(jí)，例如GPT-4參數(shù)量是GPT-3的16倍，達(dá)到1.6萬(wàn)億個(gè);而隨著圖像、音視頻等多模態(tài)數(shù)據(jù)的引入，大模型的數(shù)據(jù)量也在飛速膨脹。

　　這意味著，想要玩轉(zhuǎn)大模型，必須擁有大算力。OpenAI在生成式AI賽道上一騎絕塵，關(guān)鍵能力之一就是*強(qiáng)大的算力底座。僅僅是為了跑出GPT-3.5模型，OpenAI就使用了約1萬(wàn)顆英偉達(dá)GPU來(lái)訓(xùn)練。

　　商湯很早就開(kāi)始建設(shè)自己的算力底座。2018年前后，商湯就著手籌備大模型所需的算力、算法、數(shù)據(jù)等方面的工作;2022年1月，造價(jià)數(shù)十億元的商湯人工智能計(jì)算中心(AIDC)交付使用，初始峰值算力達(dá)到3740 Petaflops，已具備完整訓(xùn)練萬(wàn)億參數(shù)規(guī)模的大模型的能力。再加上數(shù)據(jù)層和模型層，商湯AI大裝置逐漸成型。

　　如今，商湯的AI大裝置SenseCore，依靠2.7萬(wàn)塊GPU，其算力達(dá)到5000 Petaflops，可支持20個(gè)千億參數(shù)超大模型同時(shí)訓(xùn)練，并提供涵蓋數(shù)據(jù)、訓(xùn)練工具、推理部署、性能優(yōu)化一條龍的大模型基礎(chǔ)設(shè)施服務(wù)體系。

　　不過(guò)，AI大裝置的效能如何，總算力并不是*指標(biāo)。在日常應(yīng)用中，AI大裝置需要盡可能提高多卡并行狀態(tài)下的算力利用率，盡可能保持長(zhǎng)時(shí)間穩(wěn)定運(yùn)行。目前，SenseCore支持*4000卡并行單任務(wù)訓(xùn)練，實(shí)現(xiàn)了多卡并行狀態(tài)下的高算力利用率，還能持續(xù)7天以上不間斷穩(wěn)定訓(xùn)練。

　　此外，SenseCore提供了模塊化、全鏈條的數(shù)據(jù)、訓(xùn)練及推理能力，可實(shí)現(xiàn)百億級(jí)數(shù)據(jù)管理及檢索、人工標(biāo)注服務(wù)，一鍵量化、一鍵部署、一鍵應(yīng)用，實(shí)現(xiàn)大模型快速上線驗(yàn)證。

　　自研自建的算力底座，為商湯在大模型領(lǐng)域施展手腳提供了舞臺(tái)。

　　像SenseCore這樣的AI大裝置，其價(jià)值不僅體現(xiàn)在對(duì)于商湯現(xiàn)有大模型的支撐上，更指向未來(lái)發(fā)展。在源源不斷的數(shù)據(jù)澆灌下，AI大裝置能夠以更高效、更經(jīng)濟(jì)的方式批量訓(xùn)練大模型，并縮短從研發(fā)到部署再到應(yīng)用的鏈條，成為商湯大模型體系應(yīng)用落地的推力引擎。

　　政策指引行業(yè)發(fā)展，AI大模型加速落地

　　目前，生成式AI大模型已經(jīng)成為全球各國(guó)的關(guān)注焦點(diǎn)。作為下一代互聯(lián)網(wǎng)的關(guān)鍵基礎(chǔ)設(shè)施，中國(guó)科技行業(yè)正在積極自主研發(fā)大模型，而配套的監(jiān)管政策也已在路上。

　　近日，國(guó)家網(wǎng)信辦發(fā)布《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》。征求意見(jiàn)稿指出，國(guó)家支持人工智能算法、框架等基礎(chǔ)技術(shù)的自主創(chuàng)新、推廣應(yīng)用、國(guó)際合作，鼓勵(lì)優(yōu)先采用安全可信的軟件、工具、計(jì)算和數(shù)據(jù)資源。

　　同時(shí)，征求意見(jiàn)稿對(duì)于生成式AI產(chǎn)品及服務(wù)的提供者做出多項(xiàng)明確要求，包括遵守法律法規(guī)的要求，尊重社會(huì)公德、公序良俗等，為其發(fā)展路徑指明方向、劃定紅線。

　　上述文件有望成為國(guó)內(nèi)生成式AI產(chǎn)業(yè)的首份監(jiān)管文件。它在釋放鼓勵(lì)發(fā)展的積極信號(hào)的同時(shí)，也設(shè)置了一系列監(jiān)管規(guī)則，目標(biāo)是促進(jìn)生成式AI的健康發(fā)展和規(guī)范應(yīng)用。

　　各領(lǐng)域企業(yè)正在積極擁抱生成式AI，利用新技術(shù)實(shí)現(xiàn)降本增效，并把AI能力輸出給第三方企業(yè)，勾勒出充滿想象空間的商業(yè)化圖景。

　　以阿里為例，除了通義千問(wèn)接入阿里的所有產(chǎn)品外，阿里云的AI能力和算力也已經(jīng)在多個(gè)企業(yè)和機(jī)構(gòu)落地，包括OPPO、南方電網(wǎng)、復(fù)旦大學(xué)等。此外，吉利汽車、智己汽車、奇瑞新能源、毫末智行、太古可口可樂(lè)、波司登、掌閱科技等多家企業(yè)表示，將與阿里云在大模型相關(guān)場(chǎng)景展開(kāi)技術(shù)合作的探索和共創(chuàng)。

　　商湯最新發(fā)布的日日新SenseNova大模型體系，同樣應(yīng)用于諸多行業(yè)和場(chǎng)景，目前已落地20多個(gè)業(yè)務(wù)場(chǎng)景。

　　比如，智能汽車是商湯長(zhǎng)期布局的賽道。2022年，商湯智能汽車板塊量產(chǎn)交付數(shù)超50萬(wàn)輛，新增定點(diǎn)數(shù)超800萬(wàn)輛，覆蓋30多家車企的80多款車型。如今，隨著SenseNova大模型體系的推出，商湯正通過(guò)AI大模型進(jìn)一步賦能自動(dòng)駕駛和智能車艙的產(chǎn)品研發(fā)。

　　在本周的上海車展上，商湯展示了與SenseNova深入融合的絕影未來(lái)展示艙。在展示艙內(nèi)，商量SenseChat可以與用戶交流、推薦個(gè)性化內(nèi)容，甚至自動(dòng)提煉郵件信息，幫助節(jié)省閱讀時(shí)間，如果是兒童上車后還會(huì)自動(dòng)推薦進(jìn)入兒童模式;而秒畫(huà)SenseMirage能夠?yàn)橛脩糇詣?dòng)生成各種風(fēng)格的照片，為出行增添樂(lè)趣。

　　商湯絕影未來(lái)展示艙

　　借助大模型能力，商湯實(shí)現(xiàn)了BEV環(huán)視感知在國(guó)內(nèi)首批量產(chǎn)落地，還首創(chuàng)自動(dòng)駕駛GOP感知體系。此外，商湯絕影通過(guò)大模型進(jìn)行自動(dòng)化數(shù)據(jù)標(biāo)注和產(chǎn)品檢測(cè)，搭建的完整數(shù)據(jù)閉環(huán)體系，將模型迭代效率提升數(shù)百倍，目前已獲得知名車企的定點(diǎn)。

　　此外，在生物制藥領(lǐng)域，商湯與企業(yè)合作，利用AI大裝置為蛋白質(zhì)結(jié)構(gòu)大模型提供AI推理算力，并為蛋白質(zhì)相互作用模型，提供研發(fā)平臺(tái)及訓(xùn)練算力，使得抗體篩選效率提升60%。

　　商湯以AI賦能實(shí)體經(jīng)濟(jì)的能力矩陣進(jìn)一步擴(kuò)充。SenseNova一方面服務(wù)商湯自身業(yè)務(wù)，另一方面，向政企客戶開(kāi)放了多種API(應(yīng)用程序接口)�？蛻艨筛鶕�(jù)自身需求調(diào)用SenseNova的各項(xiàng)AI技術(shù)能力，比如文本生成、圖片生成、視覺(jué)感知、標(biāo)注服務(wù)等，從而低門(mén)檻、低成本、高效率地實(shí)現(xiàn)各類AI應(yīng)用。

　　基于商湯大裝置和SenseNova大模型體系，商湯面向行業(yè)提供 “大模型即服務(wù)(Model-as-a-Service)”，涵蓋自動(dòng)化數(shù)據(jù)標(biāo)注、自定義大模型訓(xùn)練、模型增量訓(xùn)練、模型推理部署、開(kāi)發(fā)效率提升等多項(xiàng)能力。

　　可以說(shuō)，商湯已經(jīng)實(shí)現(xiàn)了“技術(shù)-產(chǎn)品-應(yīng)用”的商業(yè)化內(nèi)外雙循環(huán)。長(zhǎng)期重注AI的商湯，正站在新一波技術(shù)革新的潮頭之上繼續(xù)前行。

　　榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報(bào)生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

午夜福利无码一区二区_亚洲欧洲美洲无码精品va_小sao货水好多真紧h无码视频_国产精品重口调教系列_免费播放片高清视频_按在桌子上糟蹋视频全部_一边吃奶一边摸做爽视频_高清无码午夜福利视频_97夜夜澡人人双人人人喊

生成式AI之戰(zhàn)，誰(shuí)能破局而出？

最新新聞

熱門(mén)新聞

新動(dòng)態(tài)

關(guān)注度

最話題

午夜福利无码一区二区_亚洲欧洲美洲无码精品va_小sao货水好多真紧h无码视频_国产精品 重口 调教系列_免费播放片高清视频_按在桌子上糟蹋视频全部_一边吃奶一边摸做爽视频_高清无码午夜福利视频_97夜夜澡人人双人人人喊

生成式AI之戰(zhàn)，誰(shuí)能破局而出？

相關(guān)閱讀

最新新聞

熱門(mén)新聞

新動(dòng)態(tài)

關(guān)注度

最話題

午夜福利无码一区二区_亚洲欧洲美洲无码精品va_小sao货水好多真紧h无码视频_国产精品重口调教系列_免费播放片高清视频_按在桌子上糟蹋视频全部_一边吃奶一边摸做爽视频_高清无码午夜福利视频_97夜夜澡人人双人人人喊

生成式AI之戰(zhàn)，誰(shuí)能破局而出？