文 | 佘宗明
DeepSeek火爆帶動的新一輪大模型角力,終于在2月底迎來了高潮。標志就是,分隔在大洋兩岸的兩大AI企業(yè)——OpenAI和百度,手持“4.5”的號碼牌“狹路相逢”。
2月28日,在預熱多時后,OpenAI發(fā)布了其“迄今為止規(guī)模最大、知識最豐富的聊天模型”GPT4.5。
同日,百度官宣,“百度有史以來最強大模型”文心大模型4.5將于3月16日發(fā)布,并于6月30日正式開源。
“在幻覺方面降至新水平”“具備原生多模態(tài)與深度思考等高階能力”外加“開源”,讓蓄勢待發(fā)的文心大模型4.5受到了多方聚焦。
若只是“就模型看模型”,從GPT-4.5和文心大模型4.5的區(qū)別中看到的也許不過是幾個側(cè)面。但若將視角拉得更遠、維度拉得更高,會意識到二者路徑差異的鏈式反應很可能延續(xù)到以“應用落地”為主題的后半場,成為中美AI競爭未來方位變化的顯微鏡。
據(jù)了解,OpenAI的GPT-5、百度的下一代大模型文心大模型5.0都將在今年內(nèi)發(fā)布,屆時“隔空斗法”的情勢如何,興許也能從此次迂回交鋒中窺見端倪。
需要注意的是,近期接連打出“開源+免費”組合拳的百度,在文心大模型4.5上延續(xù)了開放立場。“開源+免費”,也是理解百度如何在大模型第二場角力搶占主動權(quán)的題眼。
01
要是在1年多前就將風行于移動互聯(lián)網(wǎng)時期的“下半場”敘事引入AI領(lǐng)域,那難免會被認為是言之過早。
但到了今天,隨著Scaling law邊際效應遞減,DeepSeek又在“大力出奇跡”的道路旁開了個“四兩撥千斤”的岔口,大模型競爭轉(zhuǎn)場到下個階段的態(tài)勢已清晰可見。
問題來了:第二場,比的是什么?從歷次科技革命深處傳來的答案,指向了應用。
李彥宏說“基礎(chǔ)模型只有在能夠大規(guī)模有效解決現(xiàn)實世界問題時才真正有價值”,斯坦福教授吳恩達說“未來AI的競爭不是比誰模型大,而是比誰能把技術(shù)塞進企業(yè)工作流”,本質(zhì)上強調(diào)的是同一點,那就是:應用,應用,應用。
這是基于產(chǎn)業(yè)發(fā)展規(guī)律的洞見:每次技術(shù)變革,在“價值鏈金字塔”中貢獻最大的均是應用層,移動互聯(lián)網(wǎng)時代從應用層到基礎(chǔ)設(shè)施的倒三角型利益分配,支撐了移動生態(tài)的長久繁榮,就是直觀注解。
如果說以往很多AI應用開發(fā)者在Scaling law筑起的大山面前只能望而卻步,那隨著技術(shù)成本降低和開源生態(tài)構(gòu)建,AI應用迎來寒武紀般的爆發(fā)已非奢望。
在此情形下,大模型競爭的“底層邏輯”也會被重構(gòu):以往是參數(shù)競賽、算力比拼,現(xiàn)在是生態(tài)爭奪、產(chǎn)業(yè)落地競速。
已全量上線DeepSeek滿血版的百度搜索就說:在大模型“狂飆”兩年后,競爭的重點已發(fā)生根本偏移:——價值錨點正從“技術(shù)驚艷度”轉(zhuǎn)向“經(jīng)濟轉(zhuǎn)化率”;競爭維度正從“實驗室指標”擴展到“產(chǎn)業(yè)滲透深度”;勝負手正從“算法優(yōu)勢”轉(zhuǎn)變?yōu)?ldquo;生態(tài)掌控力”。
這時候,開發(fā)者生態(tài)和應用場景的豐富度成了重中之重。DeepSeek和文心大模型4.5的“降本效應”,就在為此提供支撐。
那怎樣才能更好地助力AI應用爆發(fā)?核心其實就在于兩點:以開源促AI技術(shù)平權(quán),以高性能基礎(chǔ)模型助產(chǎn)業(yè)提效。
此前DeepSeek已經(jīng)讓各方看到了大模型“開源+高性能”迸發(fā)出的能量,而文心大模型4.5想要接著引爆。
02
可以看到,2月中旬以來,大模型“開源周”業(yè)已開啟。在剛過去不久的2025全球開發(fā)者先鋒大會上,商湯科技、MiniMax、階躍星辰等多家企業(yè)就紛紛亮出自家最新的開源模型。
而帶頭宣布轉(zhuǎn)向開源的是百度。2月13日,百度宣布文心一言自4月1日起全面免費開放,次日,宣布文心大模型4.5系列將開源。
在OpenAI還在表示正在討論公開AI模型權(quán)重,馬斯克炮轟OpenAI變CloseAI后也只是表示“xAI將在Grok 3變得穩(wěn)定后對Grok 2開源”的背景下,百度在轉(zhuǎn)向開源問題上沒有擠牙膏,而是一步到位,頗堪尋味。
李彥宏在2024財報電話會議上就對此作了解釋:“我們從DeepSeek學到的一件事是,那就是將最為優(yōu)秀的模型開源供所有人使用,將可以極大地推動其應用,因為大家出于好奇自然會想去嘗試開源模型,進而推動其更廣泛的應用。”
對百度而言,推出“開源+免費”組合拳,有益于擴大自身應用生態(tài)。
開源社區(qū)的分布式創(chuàng)新模式,可以奪得生態(tài)主導權(quán),顯著降低技術(shù)優(yōu)化的邊際成本。
作為《Time》口中“全球少有的在AI上實現(xiàn)全棧布局的公司”,百度的AI四層架構(gòu)(芯片-框架-模型-應用)的垂直整合能力可以放大“開源+免費”的賦能應用價值。
盡管開源意味著會減少API調(diào)用收入,但通過“開源引流+云服務變現(xiàn)”的模式有效拉動云服務需求,有望形成“技術(shù)優(yōu)化—用戶增長—商業(yè)變現(xiàn)”的正向循環(huán),帶來長遠價值。
不僅如此,推出“開源+免費”組合拳,還有助于刷新公眾對其大模型能力的認知。
以往很多用戶了解文心大模型的切口是產(chǎn)品端的文小言(前身為文心一言),而開源和免費之后,以往埋在API調(diào)用日志中跳動的數(shù)字里的百度先進大模型能力,就可以被更多B端C端用戶感知——他們用完后沒準會感慨:原來,文心大模型還可以這樣。
說白了,“開源+免費”本身會說話,可以讓更多開發(fā)者跟普通用戶知道文心大模型API日均調(diào)用量從2023年的5000萬次增長到2024年的16.5億次并非沒有來由,文心一言在咨詢機構(gòu)沙利文的《2024年中國大模型能力評測》中拿下五大評測維度的四項第一也不是沒有依據(jù)。
正因如此,在行業(yè)外部分人還在議論閉源轉(zhuǎn)開源的態(tài)度變化時,行業(yè)內(nèi)關(guān)注得更多的卻是百度借“開源+免費”撬動“AI+云”飛輪的想象空間。
要知道,據(jù)第三方測算,文心大模型4.5系列的開源,將帶動至少百萬開發(fā)者入場,孵化出教育、醫(yī)療、制造等領(lǐng)域的千億級AI應用市場。
這意味著,百度在大模型競爭重點向應用傾斜的情況下,有了更大的重塑競爭優(yōu)勢空間。
03
“開源+免費”策略只有跟高性能基礎(chǔ)模型結(jié)合,才能帶來強動能與高勢能的疊加。
文心大模型4.5能力過硬,是支撐“技術(shù)底座開放—開發(fā)者增加—數(shù)據(jù)增多—場景豐富”增強回路的關(guān)鍵支點。
評判模型能力的常見指標里,少不了“幻覺率”這一項。幻覺向來是大模型輸出采信度的最大“天敵”,從當年ChatGPT被調(diào)侃為CheatGPT起,AI“一本正經(jīng)地胡說八道”“制造信息污染”問題就引發(fā)了公眾警惕。
在那些容錯率極低的應用場景(如金融、安全)內(nèi),看似細小的幻覺問題很可能給行業(yè)企業(yè)帶來重大損失。
要知道,百度文心大模型的主要賣點,就是幻覺率大幅減少。
文心大模型4.5在融入了百度結(jié)合搜索技術(shù)積累形成的模型特色RAG(檢索增強生成)和首創(chuàng)的iRAG(基于檢索增強的文生圖技術(shù))后,就被業(yè)界寄予了“在消除幻覺上實現(xiàn)新突破”的期望,其中也包括攻克公認難題——AI生圖幻覺問題。
iRAG憑著大模型生成能力跟百度搜索億級圖片庫這個“外掛知識庫”結(jié)合,實現(xiàn)了對特定人物、場景的高還原度,消除了圖像生成中的AI味,就為此提供了解決思路。
憑借該技術(shù),品牌海報制作成本可以從數(shù)十萬元降至近乎零,影視漫畫行業(yè)的內(nèi)容生產(chǎn)效率可以提升數(shù)十倍以上。
值得注意的是,百度搜索在接入DeepSeek時沒有簡單“拿來主義”,而是利用RAG為DeepSeek提供更精準的知識來源,優(yōu)化模型輸出的可靠性與專業(yè)性,所以DeepSeek inside的百度搜索幻覺率往往也低于其他AI搜索工具。
從進階能力看,現(xiàn)實中,生成式AI常面臨兩大痛點:一是多模態(tài)協(xié)同,二是深度思考能力。
從單一的文本語義理解到多模態(tài)能力,是AI技術(shù)的關(guān)鍵迭代。多模態(tài)協(xié)同催生的“看聽說寫畫”的應用場景,可以讓AI的表現(xiàn)更真實,因而也被視作通用人工智能(AGI)發(fā)展的關(guān)鍵。谷歌公司此前發(fā)布的《2025年AI商業(yè)趨勢報告》預測,2025年多模態(tài)AI將成為企業(yè)采用AI的主要驅(qū)動力,助力改善客戶體驗,提高運營效率,開發(fā)新商業(yè)模式。
但具備原生多模態(tài)能力而非“拼接型”,能實現(xiàn)文本、圖像、語音、視頻、代碼深度融合的大模型,還不是很多。
深度思考是DeepSeek給很多人留下的強心智點所在。輸入問題(即便是復雜的 STEM即科學、技術(shù)、工程和數(shù)學問題)后,看著對話框里蹦出思考過程,不少人會對大模型的拓展推理能力驚呼“瑞思拜”。
但兼具這兩項能力的大模型很少,GPT4.5跟o3‑mini也是分別擅長前后者。
RAG 和iRAG跟“理解-檢索-生成”協(xié)同優(yōu)化框架帶來的多模態(tài)檢索協(xié)同能力,還有異構(gòu)信息統(tǒng)一表示、沖突信息邏輯推理能力,則為文心大模型4.5兼具這兩大能力提供了基礎(chǔ)。
04
“開源+免費”帶來成本下降,模型能力升級帶來性能提升,集兩點于一身的文心大模型4.5,不啻為給開發(fā)應用的便捷度加了N倍“杠桿”。
到頭來,此舉可以加速技術(shù)傳播與應用創(chuàng)新,構(gòu)建更活躍的生態(tài)系統(tǒng),進而吸引用戶沉淀場景數(shù)據(jù),再反哺模型性能優(yōu)化,打通整個閉環(huán)。
“謀一時,莫如謀長久;謀一域,莫如謀全局”,置于應用生態(tài)構(gòu)建已成大模型競爭重點的語境中,對強大模型開源,無疑是更貼合“長期主義”要義的謀長久與謀全局。
對百度來講,“開源+免費”能成為將百度積累的AI全棧能力釋放的倍增器。
文心大模型4.5的開源,百舸AI異構(gòu)計算平臺4.0的發(fā)布,昆侖芯三代萬卡集群的點亮,帶來的遠不只是加法效果,而是乘數(shù)效應。2024年累計幫用戶精調(diào)3.3萬個大模型,開發(fā)出逾77萬個企業(yè)級應用,只是其乘數(shù)效應尚未被完全開發(fā)的結(jié)果,更可期的是以后。
而應用全面爆發(fā),反過來也會增強百度在大模型角力下半場的優(yōu)勢。
對中國AI產(chǎn)業(yè)來講,大小模型在“開源”紐帶連接下形成的緊密技術(shù)共同體,能加速應用遍地開花的節(jié)奏。
從DeepSeek模型到文心大模型4.5,都在接連將AI應用開發(fā)成本“打下來”。“創(chuàng)新的本質(zhì)是成本下降與生產(chǎn)力提升”,伴隨成本下降而至的,必定是應用生態(tài)的更加繁榮。而應用生態(tài)繁榮的“烈火”,遇上中國市場海量應用場景的“干柴”,結(jié)局也充滿想象空間。
從中美AI角力角度看,當大模型競爭格局從單一模型的對決變?yōu)樯鷳B(tài)體系的對壘時,優(yōu)勢天平往往也會朝更開放的那一方傾斜。
GPT-4.5跟文心大模型4.5之間的界域里,就橫亙著一道墻,墻上就寫著——誰能通過開放生態(tài)加速AI應用落地,誰就能掌握更多AI時代的標準定義權(quán)和規(guī)則制定權(quán)。
從DeepSeek到百度,很多中國大模型企業(yè)就在以開放生態(tài)為棋,在全球AI競爭的新版圖上落子卡位。
眼下正要攜文心大模型4.5登場的百度,出場BGM就很帶感——“下個,路口,見”。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...