當(dāng)7月16日身著唐裝的黃仁勛在公開演講中,將MiniMax與“DeepSeek、阿里巴巴、百度”一同提及,并稱“開發(fā)的產(chǎn)品都是世界級”時,沉寂半年之久的AI四小強,頗似甄嬛回宮,手里拿上了逆襲劇本。
實際上,進入7月,扎堆推出Deep Research的AI四小強,正躍躍欲試重新登上牌桌。
近期,階躍星辰的階躍AI Deep Research正式開啟邀請測試,此前6月,MiniMax連續(xù)5天上新了推理模型M1、視頻生成模型、Agent等,其中MiniMax-M1集成了包括Deep Research(深度研究)在內(nèi)的技能,同在6月,月之暗面的Kimi Research跟上。而早在3月底,智譜發(fā)布了AutoGLM沉思版,作為智能體(AI Agent)也融合了Deep Research能力。
截止發(fā)稿前,AI四小強已全搶上這一波Deep Research的船票,并在7月爭先恐后在模型層上新,前半年低調(diào)發(fā)育的AI四小強,在大廠夾擊下正迅速追上。
“現(xiàn)在大模型進入了深水區(qū),單靠模型參數(shù)或者Demo已經(jīng)沒辦法說服市場了,”某頭部創(chuàng)投機構(gòu)聯(lián)創(chuàng)林晟(化名)告訴字母榜,對商業(yè)化壓力越來越大的AI四小強而言,在垂直領(lǐng)域做深,做更能交付價值的Deep Research以及Agent,都是在大廠圍剿中較為安全的生態(tài)位。
AI四小強也“需要通過跟上Deep Research這樣關(guān)鍵的技術(shù)迭代向投資人證明,他能在大模型下半場占有一席之地。”林晟補充道。
同時,對AI四小強來說,跟進Deep Research,押注可以自主規(guī)劃任務(wù)并交付結(jié)果的AI Agent,不僅是為重上牌桌,也是要搏一個“錢景”。
據(jù)外媒報道,為了使用OpenAI面向ChatGPT Pro用戶推出的Agent “Deep Resaerch”,約20%的用戶升級成了每月訂閱費高達200美元的Pro會員。同時,恒業(yè)資本管理合伙人江一告訴字母榜,隨著DeepSeek的爆火,他們慧辰股份推出的消費Agent,原本在AI方面沒有投入預(yù)算的客戶,已經(jīng)將原本信息化的預(yù)算挪向AI,而這些應(yīng)用Agent的訂單往往都在數(shù)百萬級別。
這一次,AI四小強能重新上桌嗎?
01
在2025年的AI Agent熱潮里,Deep Resaerch(深度研究)類的產(chǎn)品是最早落地的一批。
從去年底谷歌發(fā)布*Deep Resaerch開始,數(shù)月內(nèi),OpenAI、Anthropic等迅速跟進,能做PPT、寫財報分析、進行學(xué)術(shù)研究的Deep Resaerch成了新的技術(shù)標(biāo)桿,也讓AI Agent在用AI 輔助人的道路上向前邁了一步。
如今AI四小強都推出了自家的Deep Research,正面硬剛字節(jié)、騰訊等大廠。
不過需要注意的是,Agent作為四小強關(guān)鍵的技術(shù)展示窗口,楊植麟們的表現(xiàn)頗為謹(jǐn)慎。都以內(nèi)測版開路,通過一個月的小范圍內(nèi)測,去收集專業(yè)用戶的反饋意見,在調(diào)試后才全量上線。
這種謹(jǐn)慎開大的做法也顯露出AI四小強對這次亮相的重視。
此外,在Deep Resaerch的路徑選擇上,AI四小強也分裂出了兩種路徑。
一條路徑崇尚傻瓜式操作,門檻更低,以月之暗面的Kimi-Researcher為代表,摸著OpenAI、Gemini過河。正如OpenAI demo所演示的一般,用戶只需發(fā)出指令,合上電腦等待,就能得到一份達到研究分析師水準(zhǔn)的報告。和月之暗面選擇同樣路徑的,還有字節(jié)。
這種路徑選擇讓AI自主思考和理解,推理和調(diào)用工具來解決問題,極大降低了用戶的使用門檻。“用戶不需要準(zhǔn)備復(fù)雜的提示詞,只需要等待,甚至為了沒有耐心的大部分用戶,OpenAI官方宣稱任務(wù)交付時長在1-30分鐘,測試下來Kimi-Researcher一般都會在10-20內(nèi)生成結(jié)果。”在某國企AI相關(guān)部門就職的宋城(化名)告訴字母榜。
另一種則是高用戶互動型,結(jié)果很可控,包括智譜、Minimax,選擇了類Manus的工作流(Workflow)模式。
此外,Kimi還會提供一份可視化的報告,提供提供卡片、表格、思維導(dǎo)圖等多種信息,目前ChatGPT 尚未提供類似的功能。
在這種模式下,用戶需要準(zhǔn)備復(fù)雜的提示詞,提示詞的復(fù)雜程度決定了生成效果,而且在Agent工作過程中,隨著持續(xù)調(diào)用工具,用戶需要加入提供反饋,宋城表示,這種模式AI的動作軌跡都一早設(shè)計好,可控性更高,只是用戶被綁在了任務(wù)上,“如果一個任務(wù)需要跑1-2個小時,為了及時給AI做確認(rèn)、糾偏,需要時刻注意頁面。”
但最終兩種路線的分歧,實際上都指向了一個核心問題,即無論走哪一條路,當(dāng)下大模型的能力還不足以支持更智能的Agent的推出,對用戶來說,每次任務(wù)執(zhí)行都有開盲盒的錯覺,因此AI四小強也在補足自身的模型能力。
無論是Mini Max推出的M1新模型,上下文的長度達到一兆,還是月之暗面的K2模型,總參數(shù)量達到一萬億,就在7月25日,階躍星辰場發(fā)布了Step 3大模型。針對國產(chǎn)卡32K上下文,這代模型推理效率最高可達到deepseek R1的300%。
02
事實上,從AI六小龍到AI四小強,楊植麟們的2025年過的頗為艱難。
隨著年初Deepseek帶起推理模型的新潮流,原本佛系觀戰(zhàn)的騰訊攜元寶強勢下場,阿里也用夸克瀏覽器爭奪新流量入口,字節(jié)的豆包短暫從下載榜滑落,但憑借頻繁的迭代上新持續(xù)探入垂直場景。
“在年初我們(Kimi)停止投流之后, 國內(nèi)不少應(yīng)用商店搜索 kimi 甚至*頁都看不見, 在蘋果 App Store 搜 kimi 會推薦豆包, 在某度搜 kimi 會推薦 某度 DeepSeek-R1 滿血版。”
Kimi發(fā)布K2 大模型后,Kimi 的技術(shù)員公開表示,即便面對如此艱難的情況,Kimi 也沒有恢復(fù)投流。
去年在大模型賽道上激進砸錢推流的AI六小龍,一時之間陷入了對自身技術(shù)實力的自證漩渦。這似乎也讓楊植麟們意識到,技術(shù)實力似乎遠(yuǎn)比用戶規(guī)模,更能決定大模型創(chuàng)企的發(fā)展。
半年內(nèi),AI四小強悄悄調(diào)整重心,在生存壓力下,放棄對用戶規(guī)模的追逐成了*步。
從去年12月至今,一批負(fù)責(zé)應(yīng)用和商業(yè)化的六小龍高管相繼離開。其中包括但不限于前智譜COO張帆、前MiniMax商業(yè)化負(fù)責(zé)人魏偉、前月之暗面核心產(chǎn)品負(fù)責(zé)人明超平、前階躍星辰“冒泡鴨”產(chǎn)品負(fù)責(zé)人張心皓(尚未離職,轉(zhuǎn)為內(nèi)部顧問)等等。月之暗面也傳出了調(diào)整投放策略的消息。
從Deepseek的推理模型,海外科技大廠如Claude、XAI等在Deep Resaerch上的新突破,到Manus的Agent熱,大模型的競爭熱詞短短數(shù)月?lián)Q了幾輪,被DeepSeek沖擊估值體系的AI四小強,不得不重新將技術(shù)迭代確立為公司的最高優(yōu)先級。
而在這場AI時代的“注意力資源”比拼之戰(zhàn)中,重新跟上節(jié)奏的AI四小強,需要向外界證明自己有重上牌桌的實力和可能性。Agent成了*的發(fā)力點。
“過去國內(nèi)大模型都在對標(biāo)OpenAI、復(fù)制OpenAI,現(xiàn)在在Agent這樣的應(yīng)用層,要打差異化了。”江一告訴字母榜,AI頭部創(chuàng)企正試圖在垂直技術(shù)的長板上去做突破,避免與大廠的同質(zhì)化競爭。
Kim7月推出萬億參數(shù)的 K2模型,為智能體任務(wù)(agentic tasks)做了專門優(yōu)化,被Hugging Face、Perplexity CEO 發(fā)文稱贊。多模態(tài)則是MiniMax的舒適區(qū),近期發(fā)布的視頻模型Hailuo 02在Artificial Analysis Video Arena評測榜上排名第二,僅次于字節(jié)的Seedance 1.0。
可以看到,跑在前面的已經(jīng)拿到了來自資本市場的好消息。
智譜頻頻傳出融資消息,又成為*正式開啟上市輔導(dǎo)備案的AI大模型創(chuàng)企,MiniMax爆出即將完成近3億美元(約合人民幣22億元)新融資,并向港交所提交IPO申請,目標(biāo)“今年內(nèi)上市”,估值從25億美元沖到40–50億美元之間。
押注Agent,AI四小強已經(jīng)跟上來了。
03
不過,在Agent時代,跟上節(jié)奏的AI四小強還需再次證明自己的價值。
技術(shù)卡位戰(zhàn)是楊植麟們首先要自證的*道坎。盡管月之暗面6月發(fā)布的 Kimi-Researcher ,聲稱在「人類最后一場考試」(Humanity's Last Exam) 中,取得了 26.9% 的 Pass@1 成績,創(chuàng)下最新的 SOTA 水平,但可以看到,相比起引發(fā)熱議的Manus、Lovert,前者拿到硅谷知名風(fēng)投Benchmark領(lǐng)投的7500萬美元融資,亮相3個月完成文生圖、視頻生成功能的迅速迭代;后者頂著全球*設(shè)計Agent的名頭得到了馬斯克的激情點贊。
更為出圈的Manus、Lovert,調(diào)用的都并非國內(nèi)的大模型。對楊植麟們而言,拿出自研Agent只是*步。他們需要用更出圈的應(yīng)用案例,證明自身技術(shù)的優(yōu)越性。
“Agent需要給客戶創(chuàng)造愿意付費并且可量化的價值。”
江一告訴字母榜,在Agent創(chuàng)企們拿著錘子找釘子的過程中,出圈的應(yīng)用案例要給客戶提供真金白銀的可量化價值,而這往往并非用ChatBot這類基礎(chǔ)功能可以達到的。他們?yōu)橐晃淮罂蛻艚桓读薃gent矩陣,涉及到從門店銷售、找高潛門店售點鋪貨,到定市場策略、協(xié)同物流等多個流程。其中,客戶有20萬地推銷售,工資高,流動性更達到60%-70%,培訓(xùn)成本占到了營收的12%。通過培訓(xùn)銷售使用Agent,客戶將原本銷售30天的入職培訓(xùn)時間縮短到了兩天,新人用agent也能達到中等偏上的銷售水平。
對AI四小強來說,找到目標(biāo)客戶后如何創(chuàng)造遠(yuǎn)大于售賣價格的交付價值,用出圈的應(yīng)用案例證明自己,是必然要闖的*關(guān)。
但在Agent大爆發(fā)的2025年,楊植麟們也缺“錢多、有耐心”的好客戶。
盡管算力價格被大廠聯(lián)手打進“厘時代”,但不同于單純對話的有限的算力消耗,需調(diào)用多個大模型、訪問多個網(wǎng)址的Agent,每個任務(wù)的Token消耗量都不低。“生成一份還可用的調(diào)研報告,要22萬token,用cursor(智能編程)一個來回就消耗300萬token”,在某國企就職的宋城告訴字母榜,對企業(yè)來說,使用Agent的成本并不算低。
同時,技術(shù)的迅速迭代也讓Agent的使用成本節(jié)節(jié)攀高。“Manus發(fā)布前核算完成單次任務(wù)的成本在2-3美元,幾輪優(yōu)化后原本成本已經(jīng)降低,但迭代添加視頻生成能力等等,成本又再次拉了上去,”前Manus員工方成(化名)告訴字母榜。
而使用成本的高昂、單次任務(wù)執(zhí)行動輒要半小時、甚至一小時完成任務(wù),就連OpenAI也在“祈求”用戶的耐心。
在OpenAI面向ChatGPT Pro用戶推出的Agent “Deep Resaerch”后,其團隊核心成員Issa Fulford接受采訪時就表示“(OpenAI Deep Resaerch)的目標(biāo)用戶是專業(yè)消費者(prosumer),那些愿意為了一個詳細(xì)報告等待 30 分鐘的人。”
根據(jù)SimilarWeb的監(jiān)測數(shù)據(jù)顯示,2025年以來,Manus的月訪問量從3月的2376萬次,跌到了6月的1730萬次;Genspark的月訪問量從4月的888萬次,下降到了6月的769次。頭部Agent 的增長頹勢也告訴我們,Agent距離跑通PMF(產(chǎn)品市場匹配度)還有一段路要走。
無論如何,可以肯定的是,AI四小強,必須開始賺錢了。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...