首頁(yè) > 資訊 > 評(píng)論

文心一言，甩開GPT-3.5，與GPT-4掰手腕？

2023/03/27 16:52 智能相對(duì)論

　　文|智能相對(duì)論

　　作者| 葉遠(yuǎn)風(fēng)

　　“請(qǐng)寫一個(gè)肯德基瘋狂星期四的段子。”

　　“我女朋友的老公應(yīng)該叫我什么?”

　　“XX微信群的群主與吳彥祖誰(shuí)更帥?”

　　......

　　給幾個(gè)搞怪的問題，戲耍一下，把答案貼出來，大家嘲諷一番。

　　在文心一言發(fā)布后，這種玩法直到今天還沒有停止的意思。

　　可能連背后的技術(shù)與產(chǎn)品人員都沒有想到，文心一言會(huì)以這樣的方式火了下去。

　　作為國(guó)產(chǎn)版ChatGPT，文心一言在發(fā)布后，除了贊譽(yù)的聲音，以各種形式被批判應(yīng)該在意料之中，ChatGPT當(dāng)初也是如此，這是產(chǎn)品不斷進(jìn)化要經(jīng)歷的過程。

　　只不過，在沒有好壞的定論中，到底要給文心一言當(dāng)下的技術(shù)水準(zhǔn)定一個(gè)什么樣的定義，并沒有客觀的、更加令人信服的結(jié)論。

　　起碼，這種“戲耍”并不能反映多模態(tài)大模型所具備的能力。

　　ChatBOT固然可以閑聊，也應(yīng)該支持用戶隨便閑聊，但閑聊互動(dòng)不應(yīng)該成為一款專業(yè)產(chǎn)品能力的最終評(píng)價(jià)標(biāo)準(zhǔn)。

　　光怪陸離的問題，就算去詢問一個(gè)人類智者，得到的答案也是光怪陸離的。

　　現(xiàn)在來看，以某種更現(xiàn)實(shí)的視角去提出問題、實(shí)測(cè)答案，才更能體現(xiàn)出文心一言的能力和價(jià)值。

　　這種現(xiàn)實(shí)的視角應(yīng)當(dāng)有很多，其中，以企業(yè)信息需求為著眼點(diǎn)，會(huì)是其中之一。

　　這是因?yàn)�，從文心系列大模型走向�(qū)υ挳a(chǎn)品“一言”，或者，從GPT-3.5到GPT-4，ChatBOT最后都還是要走向商用、服務(wù)企業(yè)，創(chuàng)造專業(yè)價(jià)值的。

　　GPT-4發(fā)布后并沒有公布其參數(shù)量，這被認(rèn)為是走向商業(yè)化的準(zhǔn)備，畢竟OpenAI制定的數(shù)億美元營(yíng)收目標(biāo)現(xiàn)在快到4月份了還沒太大動(dòng)靜。

　　而服務(wù)企業(yè)，要么提供“生產(chǎn)力”價(jià)值，這是ChatBOT場(chǎng)景垂直化后需要探索的內(nèi)容，在各產(chǎn)業(yè)提供具體的工作能力;要么提供信息價(jià)值，通過類似“上帝之眼”的信息整合與邏輯梳理能力，幫助企業(yè)消除信息不對(duì)稱，獲取需要的信息。

　　目前ChatBOT的產(chǎn)業(yè)應(yīng)用還未見，因此信息價(jià)值就成為可以客觀評(píng)價(jià)的維度。

　　“智能相對(duì)論”團(tuán)隊(duì)獲得了文心一言的內(nèi)測(cè)賬號(hào)，以及ChatGPT普通版本(基于GPT-3.5)與plus版本(基于GPT-4)的測(cè)試資格，嘗試從企業(yè)信息獲取維度，提出六個(gè)關(guān)聯(lián)問題，從各答案中對(duì)比出文心一言的實(shí)際能力。

　　總體上，文心一言甩開GPT-3.5不成問題，與GPT-4能夠掰手腕做到有來有回。

　　具體一個(gè)個(gè)分析，每個(gè)問題下，分別是文心一言、ChatGPT普通版、ChatGPT plus版的回答截圖。

　　01、企業(yè)數(shù)字轉(zhuǎn)型怎么找外部合作伙伴，現(xiàn)在有哪些類型的伙伴可以選擇?

　　可以看出，在三個(gè)回答中，只有文心一言提到了選擇外部合作伙伴要注意到的幾點(diǎn)，然后再例舉可以找哪些類型的合作伙伴。

　　而ChatGPT普F通版、ChatGPT plus版都只是直接給出了類型。

　　這顯示出，文心一言在算法上，相較與其他兩個(gè)產(chǎn)品，對(duì)問題的潛在需求認(rèn)識(shí)可能更加深刻。

　　02、企業(yè)應(yīng)該怎樣抓住新的市場(chǎng)機(jī)遇?

　　在這個(gè)問題的回答中，很顯然，條目的多少，基本上決定了答案的質(zhì)量。

　　對(duì)一個(gè)企業(yè)來說，要抓住市場(chǎng)機(jī)遇，就應(yīng)該要找到更多的方法，考驗(yàn)的是ChatBOT整合信息并分門別類的能力。

　　在這里，文心一言超越GPT-3.5但略遜于GPT-4。

　　03、企業(yè)怎么招徠優(yōu)質(zhì)人才，有哪些好用的渠道?

　　與上一個(gè)問題類似，條目的多少直觀反映了chatBOT解決需求的能力。

　　文心一言遠(yuǎn)超GPT-3.5，并超越了GPT-4，再一次掰贏了手腕。

　　04、員工的工作效率很低，怎么辦?

　　這一局，相似的判斷標(biāo)準(zhǔn)，文心一言繼續(xù)領(lǐng)先GPT-3.5，但沒有打贏GPT-4。

　　05、客戶總是不回款，有什么好的辦法?

　　這個(gè)問題，由于各個(gè)回答都涉及了可能破壞企業(yè)與客戶關(guān)系的行動(dòng)，因此都進(jìn)行了一次“打補(bǔ)丁”式的追問。

　　基本上，三個(gè)模型都很好地領(lǐng)會(huì)到了追問的意圖，對(duì)“不和客戶關(guān)系搞僵”有準(zhǔn)確的認(rèn)知，并提供了對(duì)應(yīng)的答案。

　　其中GPT-4的表現(xiàn)超越文心一言。(注意ChatGPT有字?jǐn)?shù)限制，plus版限制在700字左右，所以其輸出因?yàn)樽謹(jǐn)?shù)太多最后被中止)

　　06、企業(yè)資金鏈緊張，但是銀行不肯借錢，怎么辦?

　　吸取上個(gè)問題的教訓(xùn)，這個(gè)問題直接把限制條件加入到問題當(dāng)中。

　　類似上一個(gè)問題，三個(gè)模型對(duì)“銀行不借錢”情形下企業(yè)資金鏈緊張的應(yīng)對(duì)辦法都有清晰的認(rèn)知，規(guī)避了銀行信貸這一種方式。

　　其中，文心一言與GPT-4打成了平手，都提供了相同數(shù)量的方法供企業(yè)選擇。

　　總結(jié)以上，僅就這六個(gè)企業(yè)比較關(guān)心的專業(yè)問題而言，文心一言全面勝過GPT-3.5，對(duì)GPT-4兩勝、兩負(fù)一平，典型的你來我往掰手腕。

　　而更進(jìn)一步看，實(shí)際上在回答條目上的勝負(fù)，無關(guān)算法本身的設(shè)計(jì)，在技術(shù)上與算法訓(xùn)練的數(shù)據(jù)量和訓(xùn)練時(shí)長(zhǎng)有關(guān)(要給足夠多的食物，也要給足夠多的時(shí)間去吃食物)，后續(xù)的競(jìng)逐將仍然在數(shù)據(jù)訓(xùn)練上。

　　對(duì)文心一言而言，發(fā)布更晚已經(jīng)吃了虧，下一步如何在訓(xùn)練上追趕、趕超(可能意味著巨大的成本投入)是百度要考慮的問題。

　　當(dāng)然，由于文心系列大模型過去早已具備了豐富的多模態(tài)能力，因此文心一言在發(fā)布時(shí)就自帶有GPT進(jìn)化到“4代”才加入的多模態(tài)能力，這一點(diǎn)也常常為業(yè)界所忽略。

　　而“智能相對(duì)論”認(rèn)為，未來ChatBOT的比拼，將很大程度上在多模態(tài)展開。

　　這意味著，當(dāng)下的文本競(jìng)逐，只是一切的開始。

　　現(xiàn)在，任何的結(jié)論，不管是褒揚(yáng)的還是貶低的，可能都為時(shí)尚早。

　　榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報(bào)生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

女攻h女主有性器_青楼调教肉hh文高辣_呻吟双腿无力白浊bl双性_初尝禁果稚嫩宫交h疯狂的兔_小龙女乞丐高辣h文_第三部小莹乱翁回乡下_罗宾被扒开腿做同人漫画_三妻四妾免费观看完整版_妞干网手机免费视频

文心一言，甩開GPT-3.5，與GPT-4掰手腕？

最新新聞

熱門新聞

新動(dòng)態(tài)

關(guān)注度

最話題

女攻h女主有性器_青楼调教肉hh文高辣_呻吟双腿无力白浊bl双性_初尝禁果稚嫩宫交h疯狂的兔_小龙女乞丐高辣h文_第三部小莹乱翁回乡下_罗宾被扒开腿做同人漫画_三妻四妾免费观看完整版_妞干网手机免费视频

文心一言，甩開GPT-3.5，與GPT-4掰手腕？

相關(guān)閱讀

最新新聞

熱門新聞

新動(dòng)態(tài)

關(guān)注度

最話題

文心一言，甩開GPT-3.5，與GPT-4掰手腕？