建議阿里們，不要著急搶行業(yè)大模型的「飯碗」

2023/09/27 10:15 微信公眾號(hào)：數(shù)據(jù)猿一蓑煙雨

　　近幾個(gè)月，國(guó)內(nèi)大模型領(lǐng)域一個(gè)很明顯的發(fā)展態(tài)勢(shì)，就是大家扎堆行業(yè)大模型。不僅各個(gè)垂直領(lǐng)域的企業(yè)發(fā)布多個(gè)行業(yè)大模型，而且百度、阿里巴巴、華為、騰訊、京東等頭部巨頭，也把行業(yè)大模型作為一個(gè)關(guān)鍵的發(fā)力點(diǎn)。

　　具體來(lái)看，根據(jù)大模型在其戰(zhàn)略中的比重，這些廠商又可以分為兩類(lèi)：

　　百度、阿里巴巴、騰訊、科大訊飛這幾家，通用大模型與行業(yè)大模型并重。

　　一方面，他們比較注重通用大模型，并將通用大模型開(kāi)放給C端用戶使用。百度文心一言、科大訊飛的訊飛星火甚至做了手機(jī)端APP，來(lái)推進(jìn)通用大模型的應(yīng)用。

　　另一方面，他們也非常注重行業(yè)大模型。一般通過(guò)行業(yè)解決方案的形式，對(duì)外輸出。甚至，在9月19日，百度直接推出了一個(gè)醫(yī)療行業(yè)大模型——靈醫(yī)大模型，直接服務(wù)醫(yī)院、患者、醫(yī)藥器械企業(yè)。

　　另外一類(lèi)，則以華為、京東為代表，他們從一開(kāi)始就主打產(chǎn)業(yè)大模型，直接面向行業(yè)應(yīng)用。

　　華為盤(pán)古大模型一開(kāi)始打出的口號(hào)就是“不作詩(shī)，只做事”，其并不熱心C端應(yīng)用，幾乎把所有戰(zhàn)略重心都放在行業(yè)上。

　　京東的言犀大模型也類(lèi)似，秉承京東云“更懂產(chǎn)業(yè)的云”這一理念，京東在大模型領(lǐng)域也將重心放在行業(yè)應(yīng)用上。此外，京東健康還發(fā)布了京醫(yī)千詢大模型，作為進(jìn)軍行業(yè)領(lǐng)域的排頭兵。

　　可以發(fā)現(xiàn)，無(wú)論是“兩線并重”的百度、阿里巴巴、騰訊、科大訊飛，還是幾乎“單線作戰(zhàn)”的華為、京東，都將行業(yè)大模型作為一個(gè)兵家必爭(zhēng)之地。

　　筆者認(rèn)為，這是有問(wèn)題的。這些科技巨頭，應(yīng)該把重心放在通用大模型上，行業(yè)應(yīng)用應(yīng)該交給各個(gè)行業(yè)領(lǐng)域的合作伙伴去做，自己只做大模型的“基礎(chǔ)設(shè)施”，不碰上層應(yīng)用。

　　為什么這樣說(shuō)，接下來(lái)我們來(lái)詳細(xì)分析其中的利弊關(guān)系。

　　巨頭應(yīng)該著眼于通用大模型的研發(fā)

　　通用大模型就像整個(gè)大模型產(chǎn)業(yè)的地基，地基是否牢固，將決定了這座大廈能夠建多高。那么，現(xiàn)在的地基牢固么?

　　很遺憾，雖然目前大模型初步實(shí)現(xiàn)了智能“涌現(xiàn)”，在自然語(yǔ)言理解、內(nèi)容生成、邏輯推理方面都有長(zhǎng)足的進(jìn)步，但是還不夠好。尤其是想讓大模型在各個(gè)行業(yè)領(lǐng)域進(jìn)行商業(yè)落地，目前的模型能力是不夠的。

　　這里說(shuō)的能力不夠強(qiáng)，不是特指某一個(gè)大模型。

　　即使是GPT-4，要想在商業(yè)領(lǐng)域落地，能力都還存在顯著的不足。我們來(lái)看幾個(gè)例子。

　　搜索引擎是大模型一個(gè)重要的應(yīng)用場(chǎng)景，微軟的必應(yīng)因?yàn)榻尤隒hatGPT，改變了原來(lái)關(guān)鍵詞的搜索方式，打了一個(gè)漂亮的翻身仗。那么，有ChatGPT助攻的必應(yīng)的真實(shí)表現(xiàn)如何呢?

　　我們?cè)囉昧艘幌�，說(shuō)實(shí)話讓人很失望。

　　以下是一個(gè)例子，讓必應(yīng)查找一下今天(9月26日)關(guān)于大模型的新聞，結(jié)果給出的四條新聞，點(diǎn)進(jìn)去之后，第1、3條內(nèi)容其實(shí)來(lái)自于一篇新聞文章，而且這條新聞是2月21日發(fā)布的;第2、4條內(nèi)容也來(lái)自同一篇新聞，這個(gè)新聞是7月27日發(fā)布的。

　　也就是說(shuō)，給出來(lái)的新聞是錯(cuò)的，我們要找今天的新聞，結(jié)果卻返回幾個(gè)月前的內(nèi)容。而且，我們是要找大模型領(lǐng)域發(fā)生的重要事件，給出來(lái)的四條答案中，有兩個(gè)報(bào)告、一篇新聞分析文章、一個(gè)論壇活動(dòng)。嚴(yán)格的說(shuō)，報(bào)告、分析文章并不算是重要的新聞事件，從這個(gè)角度來(lái)說(shuō)，必應(yīng)給出來(lái)的結(jié)果也完全不符合要求。

　　筆者接著往下問(wèn)，讓它用表格梳理一下給出的新聞內(nèi)容。結(jié)果在其給出的表格中，新聞時(shí)間都變成了9月26日，而且具體到時(shí)間點(diǎn)，這明顯就是在胡說(shuō)八道嘛。

　　筆者曾經(jīng)對(duì)必應(yīng)這類(lèi)新的搜索引擎懷有很高的期待，也嘗試過(guò)很多次。但整體的感覺(jué)就是——基本不能用。這就是ChatGPT在搜索領(lǐng)域應(yīng)用的實(shí)際表現(xiàn)，某種程度上，這已經(jīng)代表了大模型所能達(dá)到了最高水平。

　　百度也推出了類(lèi)似的功能，除了通常的網(wǎng)頁(yè)搜索外，也可以通過(guò)對(duì)話形式來(lái)進(jìn)行查詢，我們迫不及待的試了一下。

　　相對(duì)于必應(yīng)，百度對(duì)于新聞事件的理解要好一些，必應(yīng)給出了幾個(gè)報(bào)告，百度給出的結(jié)果是大模型發(fā)布，這些事件的新聞價(jià)值明顯更高。

　　但是，百度給出的這些結(jié)果靠譜么?同樣的，我們讓其以表格形式進(jìn)行統(tǒng)計(jì)，并給出新聞時(shí)間和鏈接�？梢园l(fā)現(xiàn)，時(shí)間都是5月11日的，這明顯是有問(wèn)題的，我們要的是9月26日的新聞，而不是5月11日的。

　　而且，表格里給出的新聞鏈接也有問(wèn)題，打開(kāi)對(duì)應(yīng)的網(wǎng)頁(yè)直接是“404”。當(dāng)然，微軟的必應(yīng)也有這個(gè)問(wèn)題，其給出的新聞鏈接要么打不開(kāi)、要么不存在。

　　回到ChatGPT上來(lái)，其一個(gè)重要的局限就是不能聯(lián)網(wǎng)，而且其數(shù)據(jù)沒(méi)能實(shí)時(shí)更新，GPT-3的訓(xùn)練數(shù)據(jù)集是截止到2021年9月，GPT-4的訓(xùn)練數(shù)據(jù)集是截止到2022年1月。

　　而且，ChatGPT在復(fù)雜的數(shù)據(jù)計(jì)算處理方面，經(jīng)常會(huì)出錯(cuò)。其宣稱(chēng)的文本上傳、理解能力，也并不理想。

　　讓我們來(lái)試一下GPT-4的文檔理解能力。我們上傳了龍芯中科的2023年半年報(bào)，試圖讓其來(lái)做一個(gè)簡(jiǎn)單的SWOT分析。上傳文檔之后，ChatGPT就開(kāi)始寫(xiě)代碼，來(lái)解析文檔，好像很厲害的樣子。

　　結(jié)果如何呢?

　　最終，ChatGPT沒(méi)解析出來(lái)這個(gè)PDF文檔，我們又試了好幾次，結(jié)果都是解析不出來(lái)。

　　試想一下，依托這些大模型，想要在復(fù)雜的行業(yè)場(chǎng)景落地，效果必然不會(huì)很理想，而他們已經(jīng)是現(xiàn)在市場(chǎng)上*的通用大模型了。

　　誠(chéng)然，大模型的確出現(xiàn)了一些“智能涌現(xiàn)”，能力得到質(zhì)的提升，但目前處于“小荷才露尖尖角”的初級(jí)階段。既然發(fā)現(xiàn)大模型這條道路是一個(gè)有希望的方向，那現(xiàn)在最應(yīng)該做的是快馬加鞭，好好培養(yǎng)這個(gè)有潛力的“孩子”，而不是過(guò)早的就讓其來(lái)養(yǎng)家糊口。

　　以歷史經(jīng)驗(yàn)來(lái)看，每次人工智能狂熱之后都會(huì)經(jīng)歷一段漫長(zhǎng)的沉寂，主要原因就是前期人們的期望值被拉得太高了，一旦發(fā)現(xiàn)達(dá)不到期望就會(huì)很失望。

　　同樣的，如果現(xiàn)在就匆匆將大模型在各個(gè)行業(yè)領(lǐng)域強(qiáng)行落地，很快就會(huì)迎來(lái)一個(gè)問(wèn)題爆發(fā)期，人們會(huì)從巨大的期待迅速轉(zhuǎn)變成瘋狂吐槽，這樣的大起大落是不利于行業(yè)健康發(fā)展的。

　　所以，阿里巴巴、華為、百度、騰訊這樣的科技巨頭，目前最核心的任務(wù)，就是把通用大模型這個(gè)“孩子”培養(yǎng)好。只要能力真正提上來(lái)了，那規(guī)�；涞仄鋵�(shí)是很快的，不著急在這一時(shí)半會(huì)。

　　大模型領(lǐng)域有一條著名的智能涌現(xiàn)的曲線，也就是模型的表現(xiàn)跟參數(shù)規(guī)模并不是線性相關(guān)的，不是200億參數(shù)的模型就比100億參數(shù)的模型好兩倍。

　　在這個(gè)智能涌現(xiàn)曲線上，有一個(gè)閾值，目前看這個(gè)閾值就是1000億參數(shù)左右。在這個(gè)閾值之前，模型表現(xiàn)出的智力水平并不隨著參數(shù)規(guī)模的擴(kuò)大而顯著變化，200億參數(shù)的模型跟20億參數(shù)的模型表現(xiàn)差不多。但是，當(dāng)參數(shù)規(guī)模邁過(guò)千億的門(mén)檻之后，模型的表現(xiàn)得到指數(shù)級(jí)提升。

　　雖然，模型規(guī)模不能代表一切，但從近十年的人工智能發(fā)展經(jīng)驗(yàn)來(lái)看，“數(shù)量暴力”往往是一個(gè)關(guān)鍵的方向，更大的模型、更深的神經(jīng)網(wǎng)絡(luò)、更多的數(shù)據(jù)，會(huì)帶來(lái)更好的表現(xiàn)。

　　從目前的智能涌現(xiàn)曲線來(lái)看，千億級(jí)參數(shù)規(guī)模之后，又會(huì)進(jìn)入一個(gè)智能瓶頸期，可能5000億參數(shù)的模型，跟1000億參數(shù)模型在“智力”上沒(méi)有顯著的差異。但是，如果我們要追求下一個(gè)“涌現(xiàn)閾值”，目前來(lái)看*的辦法就是繼續(xù)擴(kuò)大參數(shù)規(guī)模。也許，等參數(shù)規(guī)模擴(kuò)大到幾十萬(wàn)億之后，又會(huì)迎來(lái)下一個(gè)涌現(xiàn)閾值，大模型的能力將再上一個(gè)臺(tái)階。

　　當(dāng)然，擴(kuò)大模型規(guī)模，成本也會(huì)顯著提高，所以這只能是巨頭們的游戲。而且，單純擴(kuò)大模型規(guī)模，還會(huì)帶來(lái)過(guò)擬合的問(wèn)題。因此，模型規(guī)模的擴(kuò)大還需要配合模型架構(gòu)的優(yōu)化調(diào)整，這才是真正考驗(yàn)技術(shù)能力的地方。

　　退一步說(shuō)，現(xiàn)在的大模型都是基于Transformer架構(gòu)，而這個(gè)架構(gòu)是5年前谷歌的幾個(gè)研究人員的一篇論文提出來(lái)的。那么Transformer架構(gòu)真的是*的么，是否有更好的模型架構(gòu)呢?這些問(wèn)題，都是需要華為、百度、阿里巴巴、騰訊等科技巨頭來(lái)回答的。

　　除了參數(shù)規(guī)模、模型架構(gòu)外，大模型還需要解決“幻覺(jué)”問(wèn)題、可解釋性問(wèn)題、多模態(tài)問(wèn)題。這些問(wèn)題現(xiàn)在都沒(méi)能得到很好的解決，這是整個(gè)行業(yè)所面臨的共同難題。而要解決這些問(wèn)題，關(guān)鍵還是在于通用大模型上的底層技術(shù)突破，而不在于行業(yè)大模型。

　　當(dāng)然，誰(shuí)能真正解決這些關(guān)鍵問(wèn)題，那市場(chǎng)必定會(huì)給出對(duì)應(yīng)的獎(jiǎng)勵(lì)。

　　不要既做裁判又做運(yùn)動(dòng)員

　　之所以建議科技巨頭先不要碰行業(yè)大模型，除了通用大模型的問(wèn)題還沒(méi)解決外，另一個(gè)很重要的原因，就是避免與合作伙伴發(fā)生利益沖突。

　　對(duì)于科技巨頭而言，玩的是生態(tài)的游戲，分享的是基礎(chǔ)設(shè)施的收益。

　　在大模型領(lǐng)域，其價(jià)值傳導(dǎo)路線應(yīng)該是通用大模型-行業(yè)大模型-行業(yè)客戶。在行業(yè)大模型階段，華為、百度、阿里等通用大模型廠商既可以自研行業(yè)大模型，也可以讓第三方合作伙伴在自己通用大模型基礎(chǔ)上進(jìn)行研發(fā)。

　　通用大模型考驗(yàn)的是技術(shù)能力，而行業(yè)大模型的技術(shù)門(mén)檻并不是很高，其核心要素是數(shù)據(jù)和行業(yè)經(jīng)驗(yàn)，而這兩點(diǎn)是科技巨頭們的短板。要匯聚金融、醫(yī)療、制造、零售等各個(gè)行業(yè)的優(yōu)質(zhì)數(shù)據(jù)集，理解各行各業(yè)的業(yè)務(wù)場(chǎng)景，*不是某一家企業(yè)能夠做到的，必須依托生態(tài)的力量，用整個(gè)生態(tài)體系成千上萬(wàn)的合作伙伴去做。

　　當(dāng)然，百度、華為、騰訊這樣的通用大模型廠商，也可以兩條價(jià)值傳導(dǎo)路線都占。比如，在醫(yī)療領(lǐng)域，百度既可以用自有的靈醫(yī)大模型去直接服務(wù)醫(yī)院、患者、醫(yī)藥器械企業(yè)，同時(shí)也可以推進(jìn)垂直醫(yī)療大模型合作伙伴體系建設(shè)。

　　但是，這種情況就會(huì)面臨“與民爭(zhēng)利”的問(wèn)題，這犯了商業(yè)的大忌。

　　試想一下，某個(gè)醫(yī)療大模型企業(yè)A，建立在B企業(yè)的通用大模型基礎(chǔ)上，把自己的核心醫(yī)療數(shù)據(jù)向B開(kāi)放，訓(xùn)練醫(yī)療大模型。在幾個(gè)月之后，A發(fā)現(xiàn)B企業(yè)也推出了一個(gè)醫(yī)療大模型，而且功能跟自己的差不多。在行業(yè)客戶打單時(shí)，發(fā)現(xiàn)B企業(yè)也在競(jìng)標(biāo)，自己的合作伙伴突然變成了競(jìng)爭(zhēng)對(duì)手。如果是這種情況，A企業(yè)還愿意與B企業(yè)合作么?

　　在一個(gè)生態(tài)體系中，合作伙伴對(duì)于生態(tài)主的信任是黃金一般寶貴的東西。只有上層應(yīng)用合作伙伴堅(jiān)信生態(tài)主不會(huì)跟他發(fā)生利益沖突，不會(huì)搶他生意，他才會(huì)放心把自己的業(yè)務(wù)放在生態(tài)主構(gòu)建的平臺(tái)上。

　　這有點(diǎn)類(lèi)似于云計(jì)算領(lǐng)域IaaS廠商與SaaS廠商的關(guān)系。中國(guó)很多SaaS企業(yè)之所以對(duì)阿里云、騰訊云、百度云、華為云等云廠商不放心，最關(guān)鍵的就是怕利益沖突。目前，IaaS云廠商的業(yè)務(wù)邊界不夠清晰，不僅提供IaaS、PaaS產(chǎn)品，還進(jìn)入了不少SaaS領(lǐng)域，這是其SaaS合作伙伴最忌諱的。

　　在中國(guó)互聯(lián)網(wǎng)的早期階段，投資人對(duì)創(chuàng)業(yè)公司有一個(gè)著名的靈魂拷問(wèn)——騰訊做一個(gè)同樣的產(chǎn)品，你怎么辦?

　　同樣的道理，通用大模型廠商想構(gòu)建一個(gè)應(yīng)用生態(tài)，那醫(yī)療、金融、政務(wù)、制造等領(lǐng)域的行業(yè)大模型廠商也會(huì)問(wèn)——你將來(lái)做一個(gè)跟我一樣的東西，那我怎么辦?

　　那怎樣的大模型生態(tài)體系才更合理呢?可以借鑒云計(jì)算生態(tài)體系，通用大模型相當(dāng)于IaaS，行業(yè)大模型相當(dāng)于SaaS。

　　百度、華為、阿里巴巴、騰訊、京東、字節(jié)跳動(dòng)、科大訊飛等幾家頭部通用大模型廠商，專(zhuān)心做好通用大模型(IaaS+PaaS)，盡量不碰行業(yè)大模型(SaaS)，劃分好業(yè)務(wù)邊界。

　　需要指出的是，即使不做行業(yè)大模型，底層通用大模型廠商依然可以分享到大模型的行業(yè)應(yīng)用紅利。就像SaaS應(yīng)用會(huì)消耗IaaS資源，為IaaS付費(fèi)一樣，上層的行業(yè)大模型會(huì)調(diào)用下層通用大模型的能力，可以基于調(diào)用的次數(shù)和使用量，來(lái)構(gòu)建合理的商業(yè)模式。

　　比如，百度不做醫(yī)療大模型，但在文心一言基礎(chǔ)上有10個(gè)醫(yī)療大模型合作伙伴，每個(gè)合作伙伴服務(wù)1000家醫(yī)院。假定每家醫(yī)院每年付費(fèi)100萬(wàn)元，這100萬(wàn)中百度分享20%。那每個(gè)醫(yī)療大模型企業(yè)每年可收入10億元，百度的收入為10億*20%*10=20億元。這樣一來(lái)，百度只需要服務(wù)好10家合作伙伴即可，而不是去服務(wù)1萬(wàn)家醫(yī)院。

　　以此類(lèi)推，如果能夠構(gòu)建一個(gè)繁榮的行業(yè)大模型生態(tài)體系，大模型的行業(yè)應(yīng)用也可以為底層通用大模型廠商帶來(lái)上百億的收入規(guī)模。

　　對(duì)于百度、華為、騰訊、阿里巴巴這種通用大模型廠商而言，根本無(wú)需擔(dān)心錯(cuò)過(guò)行業(yè)大模型應(yīng)用的紅利。就像云計(jì)算領(lǐng)域，有哪個(gè)SaaS廠商的收入能夠媲美做IaaS的阿里云、騰訊云、華為云?

　　只要專(zhuān)心把通用大模型的地基打好，那以后就可以躺著賣(mài)“地皮”，而不用苦哈哈的搬磚建房子。我們回想一下房地產(chǎn)領(lǐng)域，*錢(qián)的是萬(wàn)科、恒大這種房地產(chǎn)開(kāi)放商么?顯然是賣(mài)地更賺錢(qián)，也更輕松。

　　對(duì)于垂直行業(yè)大模型廠商而言，他們最理想的狀態(tài)，是借鑒SaaS跨云部署策略，實(shí)現(xiàn)行業(yè)大模型的跨通用模型部署，并可將業(yè)務(wù)從一個(gè)通用模型平臺(tái)平滑遷移到另一個(gè)平臺(tái)，這樣就避免了被單個(gè)平臺(tái)綁定。當(dāng)然，目前行業(yè)大模型才處于非常初級(jí)的階段，談跨通用模型部署還為時(shí)尚早。

　　行業(yè)大模型的跨模型部署模式數(shù)據(jù)猿制圖

　　綜上，建議百度、華為、阿里巴巴、騰訊這類(lèi)科技巨頭，把注意力放在通用大模型的研發(fā)方面，而不是放在行業(yè)大模型的應(yīng)用上。

　　一方面，通用大模型現(xiàn)在還不足夠好，模型的智能水平不夠高、幻覺(jué)問(wèn)題、可解釋性差、多模態(tài)融合能力差、模型訓(xùn)練推理成本高等問(wèn)題還很突出，科技巨頭應(yīng)該去解決這些更底層、更具挑戰(zhàn)性的難題。只有這些問(wèn)題得到解決，大模型行業(yè)應(yīng)用的根基才穩(wěn)固。

　　在大模型行業(yè)應(yīng)用層面，完全可以交給上層的垂直領(lǐng)域企業(yè)去完成�？梢灶A(yù)見(jiàn)，每個(gè)領(lǐng)域都將會(huì)有成百上千家行業(yè)大模型企業(yè)競(jìng)爭(zhēng)，最后優(yōu)勝劣汰留下來(lái)幾十家，這些生存下來(lái)的企業(yè)就是合格的合作伙伴。底層通用大模型廠商應(yīng)該與合作伙伴一起構(gòu)建一個(gè)生態(tài)體系，來(lái)共同服務(wù)行業(yè)客戶。

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

　　榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報(bào)生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

建議阿里們，不要著急搶行業(yè)大模型的「飯碗」

最新新聞

熱門(mén)新聞

新動(dòng)態(tài)

關(guān)注度

最話題

建議阿里們，不要著急搶行業(yè)大模型的「飯碗」

相關(guān)閱讀

最新新聞

熱門(mén)新聞

新動(dòng)態(tài)

關(guān)注度

最話題