近幾個(gè)月,國(guó)內(nèi)大模型領(lǐng)域一個(gè)很明顯的發(fā)展態(tài)勢(shì),就是大家扎堆行業(yè)大模型。不僅各個(gè)垂直領(lǐng)域的企業(yè)發(fā)布多個(gè)行業(yè)大模型,而且百度、阿里巴巴、華為、騰訊、京東等頭部巨頭,也把行業(yè)大模型作為一個(gè)關(guān)鍵的發(fā)力點(diǎn)。
具體來看,根據(jù)大模型在其戰(zhàn)略中的比重,這些廠商又可以分為兩類:
百度、阿里巴巴、騰訊、科大訊飛這幾家,通用大模型與行業(yè)大模型并重。
一方面,他們比較注重通用大模型,并將通用大模型開放給C端用戶使用。百度文心一言、科大訊飛的訊飛星火甚至做了手機(jī)端APP,來推進(jìn)通用大模型的應(yīng)用。
另一方面,他們也非常注重行業(yè)大模型。一般通過行業(yè)解決方案的形式,對(duì)外輸出。甚至,在9月19日,百度直接推出了一個(gè)醫(yī)療行業(yè)大模型——靈醫(yī)大模型,直接服務(wù)醫(yī)院、患者、醫(yī)藥器械企業(yè)。
另外一類,則以華為、京東為代表,他們從一開始就主打產(chǎn)業(yè)大模型,直接面向行業(yè)應(yīng)用。
華為盤古大模型一開始打出的口號(hào)就是“不作詩,只做事”,其并不熱心C端應(yīng)用,幾乎把所有戰(zhàn)略重心都放在行業(yè)上。
京東的言犀大模型也類似,秉承京東云“更懂產(chǎn)業(yè)的云”這一理念,京東在大模型領(lǐng)域也將重心放在行業(yè)應(yīng)用上。此外,京東健康還發(fā)布了京醫(yī)千詢大模型,作為進(jìn)軍行業(yè)領(lǐng)域的排頭兵。
可以發(fā)現(xiàn),無論是“兩線并重”的百度、阿里巴巴、騰訊、科大訊飛,還是幾乎“單線作戰(zhàn)”的華為、京東,都將行業(yè)大模型作為一個(gè)兵家必爭(zhēng)之地。
筆者認(rèn)為,這是有問題的。這些科技巨頭,應(yīng)該把重心放在通用大模型上,行業(yè)應(yīng)用應(yīng)該交給各個(gè)行業(yè)領(lǐng)域的合作伙伴去做,自己只做大模型的“基礎(chǔ)設(shè)施”,不碰上層應(yīng)用。
為什么這樣說,接下來我們來詳細(xì)分析其中的利弊關(guān)系。
巨頭應(yīng)該著眼于通用大模型的研發(fā)
通用大模型就像整個(gè)大模型產(chǎn)業(yè)的地基,地基是否牢固,將決定了這座大廈能夠建多高。那么,現(xiàn)在的地基牢固么?
很遺憾,雖然目前大模型初步實(shí)現(xiàn)了智能“涌現(xiàn)”,在自然語言理解、內(nèi)容生成、邏輯推理方面都有長(zhǎng)足的進(jìn)步,但是還不夠好。尤其是想讓大模型在各個(gè)行業(yè)領(lǐng)域進(jìn)行商業(yè)落地,目前的模型能力是不夠的。
這里說的能力不夠強(qiáng),不是特指某一個(gè)大模型。
即使是GPT-4,要想在商業(yè)領(lǐng)域落地,能力都還存在顯著的不足。我們來看幾個(gè)例子。
搜索引擎是大模型一個(gè)重要的應(yīng)用場(chǎng)景,微軟的必應(yīng)因?yàn)榻尤隒hatGPT,改變了原來關(guān)鍵詞的搜索方式,打了一個(gè)漂亮的翻身仗。那么,有ChatGPT助攻的必應(yīng)的真實(shí)表現(xiàn)如何呢?
我們?cè)囉昧艘幌�,說實(shí)話讓人很失望。
以下是一個(gè)例子,讓必應(yīng)查找一下今天(9月26日)關(guān)于大模型的新聞,結(jié)果給出的四條新聞,點(diǎn)進(jìn)去之后,第1、3條內(nèi)容其實(shí)來自于一篇新聞文章,而且這條新聞是2月21日發(fā)布的;第2、4條內(nèi)容也來自同一篇新聞,這個(gè)新聞是7月27日發(fā)布的。
也就是說,給出來的新聞是錯(cuò)的,我們要找今天的新聞,結(jié)果卻返回幾個(gè)月前的內(nèi)容。而且,我們是要找大模型領(lǐng)域發(fā)生的重要事件,給出來的四條答案中,有兩個(gè)報(bào)告、一篇新聞分析文章、一個(gè)論壇活動(dòng)。嚴(yán)格的說,報(bào)告、分析文章并不算是重要的新聞事件,從這個(gè)角度來說,必應(yīng)給出來的結(jié)果也完全不符合要求。
筆者接著往下問,讓它用表格梳理一下給出的新聞內(nèi)容。結(jié)果在其給出的表格中,新聞時(shí)間都變成了9月26日,而且具體到時(shí)間點(diǎn),這明顯就是在胡說八道嘛。
筆者曾經(jīng)對(duì)必應(yīng)這類新的搜索引擎懷有很高的期待,也嘗試過很多次。但整體的感覺就是——基本不能用。這就是ChatGPT在搜索領(lǐng)域應(yīng)用的實(shí)際表現(xiàn),某種程度上,這已經(jīng)代表了大模型所能達(dá)到了最高水平。
百度也推出了類似的功能,除了通常的網(wǎng)頁搜索外,也可以通過對(duì)話形式來進(jìn)行查詢,我們迫不及待的試了一下。
相對(duì)于必應(yīng),百度對(duì)于新聞事件的理解要好一些,必應(yīng)給出了幾個(gè)報(bào)告,百度給出的結(jié)果是大模型發(fā)布,這些事件的新聞價(jià)值明顯更高。
但是,百度給出的這些結(jié)果靠譜么?同樣的,我們讓其以表格形式進(jìn)行統(tǒng)計(jì),并給出新聞時(shí)間和鏈接�?梢园l(fā)現(xiàn),時(shí)間都是5月11日的,這明顯是有問題的,我們要的是9月26日的新聞,而不是5月11日的。
而且,表格里給出的新聞鏈接也有問題,打開對(duì)應(yīng)的網(wǎng)頁直接是“404”。當(dāng)然,微軟的必應(yīng)也有這個(gè)問題,其給出的新聞鏈接要么打不開、要么不存在。
回到ChatGPT上來,其一個(gè)重要的局限就是不能聯(lián)網(wǎng),而且其數(shù)據(jù)沒能實(shí)時(shí)更新,GPT-3的訓(xùn)練數(shù)據(jù)集是截止到2021年9月,GPT-4的訓(xùn)練數(shù)據(jù)集是截止到2022年1月。
而且,ChatGPT在復(fù)雜的數(shù)據(jù)計(jì)算處理方面,經(jīng)常會(huì)出錯(cuò)。其宣稱的文本上傳、理解能力,也并不理想。
讓我們來試一下GPT-4的文檔理解能力。我們上傳了龍芯中科的2023年半年報(bào),試圖讓其來做一個(gè)簡(jiǎn)單的SWOT分析。上傳文檔之后,ChatGPT就開始寫代碼,來解析文檔,好像很厲害的樣子。
結(jié)果如何呢?
最終,ChatGPT沒解析出來這個(gè)PDF文檔,我們又試了好幾次,結(jié)果都是解析不出來。
試想一下,依托這些大模型,想要在復(fù)雜的行業(yè)場(chǎng)景落地,效果必然不會(huì)很理想,而他們已經(jīng)是現(xiàn)在市場(chǎng)上*的通用大模型了。
誠然,大模型的確出現(xiàn)了一些“智能涌現(xiàn)”,能力得到質(zhì)的提升,但目前處于“小荷才露尖尖角”的初級(jí)階段。既然發(fā)現(xiàn)大模型這條道路是一個(gè)有希望的方向,那現(xiàn)在最應(yīng)該做的是快馬加鞭,好好培養(yǎng)這個(gè)有潛力的“孩子”,而不是過早的就讓其來養(yǎng)家糊口。
以歷史經(jīng)驗(yàn)來看,每次人工智能狂熱之后都會(huì)經(jīng)歷一段漫長(zhǎng)的沉寂,主要原因就是前期人們的期望值被拉得太高了,一旦發(fā)現(xiàn)達(dá)不到期望就會(huì)很失望。
同樣的,如果現(xiàn)在就匆匆將大模型在各個(gè)行業(yè)領(lǐng)域強(qiáng)行落地,很快就會(huì)迎來一個(gè)問題爆發(fā)期,人們會(huì)從巨大的期待迅速轉(zhuǎn)變成瘋狂吐槽,這樣的大起大落是不利于行業(yè)健康發(fā)展的。
所以,阿里巴巴、華為、百度、騰訊這樣的科技巨頭,目前最核心的任務(wù),就是把通用大模型這個(gè)“孩子”培養(yǎng)好。只要能力真正提上來了,那規(guī)�;涞仄鋵�(shí)是很快的,不著急在這一時(shí)半會(huì)。
大模型領(lǐng)域有一條著名的智能涌現(xiàn)的曲線,也就是模型的表現(xiàn)跟參數(shù)規(guī)模并不是線性相關(guān)的,不是200億參數(shù)的模型就比100億參數(shù)的模型好兩倍。
在這個(gè)智能涌現(xiàn)曲線上,有一個(gè)閾值,目前看這個(gè)閾值就是1000億參數(shù)左右。在這個(gè)閾值之前,模型表現(xiàn)出的智力水平并不隨著參數(shù)規(guī)模的擴(kuò)大而顯著變化,200億參數(shù)的模型跟20億參數(shù)的模型表現(xiàn)差不多。但是,當(dāng)參數(shù)規(guī)模邁過千億的門檻之后,模型的表現(xiàn)得到指數(shù)級(jí)提升。
雖然,模型規(guī)模不能代表一切,但從近十年的人工智能發(fā)展經(jīng)驗(yàn)來看,“數(shù)量暴力”往往是一個(gè)關(guān)鍵的方向,更大的模型、更深的神經(jīng)網(wǎng)絡(luò)、更多的數(shù)據(jù),會(huì)帶來更好的表現(xiàn)。
從目前的智能涌現(xiàn)曲線來看,千億級(jí)參數(shù)規(guī)模之后,又會(huì)進(jìn)入一個(gè)智能瓶頸期,可能5000億參數(shù)的模型,跟1000億參數(shù)模型在“智力”上沒有顯著的差異。但是,如果我們要追求下一個(gè)“涌現(xiàn)閾值”,目前來看*的辦法就是繼續(xù)擴(kuò)大參數(shù)規(guī)模。也許,等參數(shù)規(guī)模擴(kuò)大到幾十萬億之后,又會(huì)迎來下一個(gè)涌現(xiàn)閾值,大模型的能力將再上一個(gè)臺(tái)階。
當(dāng)然,擴(kuò)大模型規(guī)模,成本也會(huì)顯著提高,所以這只能是巨頭們的游戲。而且,單純擴(kuò)大模型規(guī)模,還會(huì)帶來過擬合的問題。因此,模型規(guī)模的擴(kuò)大還需要配合模型架構(gòu)的優(yōu)化調(diào)整,這才是真正考驗(yàn)技術(shù)能力的地方。
退一步說,現(xiàn)在的大模型都是基于Transformer架構(gòu),而這個(gè)架構(gòu)是5年前谷歌的幾個(gè)研究人員的一篇論文提出來的。那么Transformer架構(gòu)真的是*的么,是否有更好的模型架構(gòu)呢?這些問題,都是需要華為、百度、阿里巴巴、騰訊等科技巨頭來回答的。
除了參數(shù)規(guī)模、模型架構(gòu)外,大模型還需要解決“幻覺”問題、可解釋性問題、多模態(tài)問題。這些問題現(xiàn)在都沒能得到很好的解決,這是整個(gè)行業(yè)所面臨的共同難題。而要解決這些問題,關(guān)鍵還是在于通用大模型上的底層技術(shù)突破,而不在于行業(yè)大模型。
當(dāng)然,誰能真正解決這些關(guān)鍵問題,那市場(chǎng)必定會(huì)給出對(duì)應(yīng)的獎(jiǎng)勵(lì)。
不要既做裁判又做運(yùn)動(dòng)員
之所以建議科技巨頭先不要碰行業(yè)大模型,除了通用大模型的問題還沒解決外,另一個(gè)很重要的原因,就是避免與合作伙伴發(fā)生利益沖突。
對(duì)于科技巨頭而言,玩的是生態(tài)的游戲,分享的是基礎(chǔ)設(shè)施的收益。
在大模型領(lǐng)域,其價(jià)值傳導(dǎo)路線應(yīng)該是通用大模型-行業(yè)大模型-行業(yè)客戶。在行業(yè)大模型階段,華為、百度、阿里等通用大模型廠商既可以自研行業(yè)大模型,也可以讓第三方合作伙伴在自己通用大模型基礎(chǔ)上進(jìn)行研發(fā)。
通用大模型考驗(yàn)的是技術(shù)能力,而行業(yè)大模型的技術(shù)門檻并不是很高,其核心要素是數(shù)據(jù)和行業(yè)經(jīng)驗(yàn),而這兩點(diǎn)是科技巨頭們的短板。要匯聚金融、醫(yī)療、制造、零售等各個(gè)行業(yè)的優(yōu)質(zhì)數(shù)據(jù)集,理解各行各業(yè)的業(yè)務(wù)場(chǎng)景,*不是某一家企業(yè)能夠做到的,必須依托生態(tài)的力量,用整個(gè)生態(tài)體系成千上萬的合作伙伴去做。
當(dāng)然,百度、華為、騰訊這樣的通用大模型廠商,也可以兩條價(jià)值傳導(dǎo)路線都占。比如,在醫(yī)療領(lǐng)域,百度既可以用自有的靈醫(yī)大模型去直接服務(wù)醫(yī)院、患者、醫(yī)藥器械企業(yè),同時(shí)也可以推進(jìn)垂直醫(yī)療大模型合作伙伴體系建設(shè)。
但是,這種情況就會(huì)面臨“與民爭(zhēng)利”的問題,這犯了商業(yè)的大忌。
試想一下,某個(gè)醫(yī)療大模型企業(yè)A,建立在B企業(yè)的通用大模型基礎(chǔ)上,把自己的核心醫(yī)療數(shù)據(jù)向B開放,訓(xùn)練醫(yī)療大模型。在幾個(gè)月之后,A發(fā)現(xiàn)B企業(yè)也推出了一個(gè)醫(yī)療大模型,而且功能跟自己的差不多。在行業(yè)客戶打單時(shí),發(fā)現(xiàn)B企業(yè)也在競(jìng)標(biāo),自己的合作伙伴突然變成了競(jìng)爭(zhēng)對(duì)手。如果是這種情況,A企業(yè)還愿意與B企業(yè)合作么?
在一個(gè)生態(tài)體系中,合作伙伴對(duì)于生態(tài)主的信任是黃金一般寶貴的東西。只有上層應(yīng)用合作伙伴堅(jiān)信生態(tài)主不會(huì)跟他發(fā)生利益沖突,不會(huì)搶他生意,他才會(huì)放心把自己的業(yè)務(wù)放在生態(tài)主構(gòu)建的平臺(tái)上。
這有點(diǎn)類似于云計(jì)算領(lǐng)域IaaS廠商與SaaS廠商的關(guān)系。中國(guó)很多SaaS企業(yè)之所以對(duì)阿里云、騰訊云、百度云、華為云等云廠商不放心,最關(guān)鍵的就是怕利益沖突。目前,IaaS云廠商的業(yè)務(wù)邊界不夠清晰,不僅提供IaaS、PaaS產(chǎn)品,還進(jìn)入了不少SaaS領(lǐng)域,這是其SaaS合作伙伴最忌諱的。
在中國(guó)互聯(lián)網(wǎng)的早期階段,投資人對(duì)創(chuàng)業(yè)公司有一個(gè)著名的靈魂拷問——騰訊做一個(gè)同樣的產(chǎn)品,你怎么辦?
同樣的道理,通用大模型廠商想構(gòu)建一個(gè)應(yīng)用生態(tài),那醫(yī)療、金融、政務(wù)、制造等領(lǐng)域的行業(yè)大模型廠商也會(huì)問——你將來做一個(gè)跟我一樣的東西,那我怎么辦?
那怎樣的大模型生態(tài)體系才更合理呢?可以借鑒云計(jì)算生態(tài)體系,通用大模型相當(dāng)于IaaS,行業(yè)大模型相當(dāng)于SaaS。
百度、華為、阿里巴巴、騰訊、京東、字節(jié)跳動(dòng)、科大訊飛等幾家頭部通用大模型廠商,專心做好通用大模型(IaaS+PaaS),盡量不碰行業(yè)大模型(SaaS),劃分好業(yè)務(wù)邊界。
需要指出的是,即使不做行業(yè)大模型,底層通用大模型廠商依然可以分享到大模型的行業(yè)應(yīng)用紅利。就像SaaS應(yīng)用會(huì)消耗IaaS資源,為IaaS付費(fèi)一樣,上層的行業(yè)大模型會(huì)調(diào)用下層通用大模型的能力,可以基于調(diào)用的次數(shù)和使用量,來構(gòu)建合理的商業(yè)模式。
比如,百度不做醫(yī)療大模型,但在文心一言基礎(chǔ)上有10個(gè)醫(yī)療大模型合作伙伴,每個(gè)合作伙伴服務(wù)1000家醫(yī)院。假定每家醫(yī)院每年付費(fèi)100萬元,這100萬中百度分享20%。那每個(gè)醫(yī)療大模型企業(yè)每年可收入10億元,百度的收入為10億*20%*10=20億元。這樣一來,百度只需要服務(wù)好10家合作伙伴即可,而不是去服務(wù)1萬家醫(yī)院。
以此類推,如果能夠構(gòu)建一個(gè)繁榮的行業(yè)大模型生態(tài)體系,大模型的行業(yè)應(yīng)用也可以為底層通用大模型廠商帶來上百億的收入規(guī)模。
對(duì)于百度、華為、騰訊、阿里巴巴這種通用大模型廠商而言,根本無需擔(dān)心錯(cuò)過行業(yè)大模型應(yīng)用的紅利。就像云計(jì)算領(lǐng)域,有哪個(gè)SaaS廠商的收入能夠媲美做IaaS的阿里云、騰訊云、華為云?
只要專心把通用大模型的地基打好,那以后就可以躺著賣“地皮”,而不用苦哈哈的搬磚建房子。我們回想一下房地產(chǎn)領(lǐng)域,*錢的是萬科、恒大這種房地產(chǎn)開放商么?顯然是賣地更賺錢,也更輕松。
對(duì)于垂直行業(yè)大模型廠商而言,他們最理想的狀態(tài),是借鑒SaaS跨云部署策略,實(shí)現(xiàn)行業(yè)大模型的跨通用模型部署,并可將業(yè)務(wù)從一個(gè)通用模型平臺(tái)平滑遷移到另一個(gè)平臺(tái),這樣就避免了被單個(gè)平臺(tái)綁定。當(dāng)然,目前行業(yè)大模型才處于非常初級(jí)的階段,談跨通用模型部署還為時(shí)尚早。
行業(yè)大模型的跨模型部署模式 數(shù)據(jù)猿制圖
綜上,建議百度、華為、阿里巴巴、騰訊這類科技巨頭,把注意力放在通用大模型的研發(fā)方面,而不是放在行業(yè)大模型的應(yīng)用上。
一方面,通用大模型現(xiàn)在還不足夠好,模型的智能水平不夠高、幻覺問題、可解釋性差、多模態(tài)融合能力差、模型訓(xùn)練推理成本高等問題還很突出,科技巨頭應(yīng)該去解決這些更底層、更具挑戰(zhàn)性的難題。只有這些問題得到解決,大模型行業(yè)應(yīng)用的根基才穩(wěn)固。
在大模型行業(yè)應(yīng)用層面,完全可以交給上層的垂直領(lǐng)域企業(yè)去完成�?梢灶A(yù)見,每個(gè)領(lǐng)域都將會(huì)有成百上千家行業(yè)大模型企業(yè)競(jìng)爭(zhēng),最后優(yōu)勝劣汰留下來幾十家,這些生存下來的企業(yè)就是合格的合作伙伴。底層通用大模型廠商應(yīng)該與合作伙伴一起構(gòu)建一個(gè)生態(tài)體系,來共同服務(wù)行業(yè)客戶。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...