近日,在36氪WAVES 舉辦的大會(huì)上,一個(gè)有趣的環(huán)節(jié)引發(fā)了人們的熱議:主辦方讓Kimi與Minimax兩家的投資人進(jìn)行了對(duì)談。
隨著DeepSeek的橫空出世,整個(gè)中國大模型的牌局已天翻地覆。行業(yè)龍頭的格局,從原來的大模型六小龍,逐漸演變成了今天的基模五強(qiáng)。
當(dāng)六小龍不再是市場(chǎng)的焦點(diǎn)時(shí),安靜很久的Kimi和Minimax在前不久不約而同有了新動(dòng)作:Kimi開源了編程模型Kimi-Dev,它的*個(gè)Agent Kimi-Researcher深度研究也開啟小范圍測(cè)試。而Minimax則開源了*推理模型Minimax-M1,并完成連續(xù)五天包含大模型、視頻生成、音頻生成等多個(gè)方向的更加。
從產(chǎn)品側(cè)來看,Kimi將重心聚焦到agent,以深度研究為主要方向,似乎有意向金融、學(xué)術(shù)等方向發(fā)力,這條路線雖然已經(jīng)有了智譜等競(jìng)爭(zhēng)者,但遠(yuǎn)離了以生活服務(wù)為主的大廠射程,疊加原本不錯(cuò)的基礎(chǔ)模型能力,Kimi似乎找到了自己的舒適區(qū)。
而另一邊,Minimax則似乎想要彌補(bǔ)自身的遺憾,在沒有接入DeepSeek之后,繼續(xù)發(fā)力全方向的布局。
這似乎也意味著,大模型競(jìng)爭(zhēng)進(jìn)入下半場(chǎng)之后,更多的變量正在醞釀之中,而從各項(xiàng)評(píng)測(cè)來看,Kimi與Minimax的新產(chǎn)品,似乎都有著不錯(cuò)的效果。
在沒等來R2之后的緩沖期,六小龍中的代表們,正在試圖攜帶著各自的大招,開啟下半場(chǎng)。而從報(bào)道來看,無論是頻繁與DeepSeek撞論文的Kimi,還是曾經(jīng)和DeepSeek賭同一個(gè)技術(shù)路徑的Minimax,似乎都帶著一絲不甘心。
而在大廠先后加入大模型賽道后,六小龍中,Kimi和Minimax正試圖找到自己的生存方式。從某種程度來說,競(jìng)爭(zhēng)的模式正在發(fā)生改變,而在泡沫消散之后,越來越懂經(jīng)營的六小龍們,也在期待著下一個(gè)周期的開始。
01
Kimi和Minimax接連放大招
“一年前,就是比投放、比用戶,現(xiàn)在則回到技術(shù)前沿,回到強(qiáng)認(rèn)知,我相信反而更適合以技術(shù)大牛為核心的創(chuàng)業(yè)團(tuán)隊(duì)。因?yàn)楸韧斗�,其�?shí)是大廠的機(jī)會(huì),所以我覺得他們狀態(tài)還挺好的。”在這次對(duì)談上,真格基金合伙人戴雨森在談到Kimi與Minimax時(shí)如是說。
正如其所言,近日,相較于在教育、醫(yī)療等垂類應(yīng)用場(chǎng)景中爭(zhēng)奪的大廠,Kimi與Minimax似乎更希望在基礎(chǔ)技術(shù)上展現(xiàn)自身的底色。
6月20日,Kimi官方發(fā)布消息,Kimi-Researcher(深度研究),開始小范圍灰度測(cè)試。據(jù)官方消息透露,模型即Agent,Kimi-Researcher 是基于端到端自主強(qiáng)化學(xué)習(xí)(end-to-end agentic RL)技術(shù)訓(xùn)練的新一代Agent模型,也是一個(gè)專為深度研究任務(wù)而生的Agent產(chǎn)品。
做為內(nèi)測(cè)用戶,可以看到的是,Kimi這次試圖去打造的就是“高實(shí)用性”以及“靠譜”的產(chǎn)品。
按照官方的數(shù)據(jù),每個(gè)任務(wù)平均進(jìn)行23步推理,自主梳理并解決需求,平均規(guī)劃74個(gè)關(guān)鍵詞,找到206個(gè)網(wǎng)址,由模型判斷并篩選出信息質(zhì)量最高的前3.2%內(nèi)容,剔除冗余、低質(zhì)信息。報(bào)告的平均長度在萬字以上,平均引用約26個(gè)高質(zhì)量、可溯源的信源。
很明顯,Kimi此次直指需要低幻覺類的垂類賽道。從小紅書等社交媒體反饋來看,論文黨、甚至如金融、法律等高頻需要深度探索的方向,都對(duì)Kimi-researcher有著不錯(cuò)的評(píng)價(jià)。
專業(yè)評(píng)測(cè)博主mactalk評(píng)價(jià)道:深度研究不算什么新創(chuàng)新,但Kimi生成的內(nèi)容,在信源和形式上確實(shí)不錯(cuò),Kimi的深度研究功能,除了給到一份分析報(bào)告外,還會(huì)生成一個(gè)網(wǎng)頁�?吹骄W(wǎng)頁的那刻,給人的感受是,網(wǎng)頁也應(yīng)該成為一種和文本同等重要的交互方式。
與此同時(shí),Minimax也用全新的模型在展示自身的肌肉。根據(jù)極客公園報(bào)道,作為推理模型,Minimax-M1在長上下文理解能力上,是目前包括所有閉源和開源模型在內(nèi),能力全球前二的模型,且在訓(xùn)練和推理成本上有極高的性價(jià)比。
M1仍然延續(xù)著MoE架構(gòu),而在注意力機(jī)制上和強(qiáng)化學(xué)習(xí)算法上的創(chuàng)新讓M1鮮明地區(qū)別于其他推理模型。模型總參數(shù)達(dá)到4560億參數(shù),原生支持100萬token的上下文長度輸入,以及目前所有模型中最長的80ktoken的輸出長度。
在專業(yè)上下文能力的測(cè)評(píng)中,M1的表現(xiàn)遠(yuǎn)超包括DeepSeek-R1-0528和Qwen3-235B在內(nèi)的所有開源模型,甚至超越OpenAI o3和Claude 4 Opus,僅小幅落后SOTA的Gemini 2.5 Pro。
除了基礎(chǔ)模型的進(jìn)展,Minimax在agent以及多模態(tài)等多個(gè)領(lǐng)域也是亮點(diǎn)頻出。“大家最近刷抖音有沒有看到‘吳彥祖教你學(xué)英語’?其實(shí)是Minimax在提供背后的技術(shù)支持。我*次聽的時(shí)候,也難以分辨到底是真人還是AI,直到后來才知道是Minimax的客戶,感嘆這真的挺厲害的。”云啟資本合伙人陳煜提到。
實(shí)用性*的agent,能力出眾的大模型,Kimi和Minimax試圖開啟的是一場(chǎng)全方位的競(jìng)速,而從更深層次上來看,兩家公司更希望表達(dá)的則是,打破大眾對(duì)于大模型賽道的固有心智。
02
渴望一場(chǎng)
DeepSeek式的勝利
相較于DeepSeek的光芒萬丈,不得不說,此刻回頭來看,Kimi與Minimax是兩家曾充滿遺憾的公司。
楊植麟清華出身,同時(shí)在卡內(nèi)基梅隆大學(xué)(CMU)語言技術(shù)研究所(LTI)讀博,導(dǎo)師是蘋果AI負(fù)責(zé)人Ruslan Salakhutdinov和Google AI首席科學(xué)家William W. Cohen,這樣的學(xué)術(shù)背景,在技術(shù)可信度上遠(yuǎn)超普通創(chuàng)業(yè)者。
而且他在循環(huán)智能等方面的創(chuàng)業(yè)經(jīng)歷,已經(jīng)在企業(yè)級(jí)AI落地方面證明過自己。這更能讓資本相信,這個(gè)人不只是懂技術(shù),還會(huì)做生意。高頻快速的融資,讓其估值迅速爬升。
技術(shù)背景,管理經(jīng)驗(yàn),同時(shí)具有大量子彈,這讓楊植麟成為前DeepSeek時(shí)代的明星。
更重要的是,Kimi的*仗還打的漂亮,把長文本技術(shù)提升到了“中國AGI突破口”的高度,精準(zhǔn)匹配了資本對(duì)其的期待。
但不可否定的是,DeepSeek的爆火,一定程度上掩蓋了Kimi的部分聲量。
不過,即便是到當(dāng)下,仍然可以看出,Kimi在技術(shù)實(shí)力上,仍然不遜于DeepSeek。在基礎(chǔ)研究環(huán)節(jié),2月18日,DeepSeek和月之暗面幾乎同時(shí)發(fā)布了他們各自最新的論文,而主題直接「撞車」—— 都是挑戰(zhàn)Transformer架構(gòu)最核心的注意力機(jī)制,讓它能更高效的處理更長的上下文。而更有趣的是,兩家公司的技術(shù)派明星創(chuàng)始人的名字,出現(xiàn)在各自的論文和技術(shù)報(bào)告里。
而在近日,兩者撞車的事件又頻頻發(fā)生。在法律、醫(yī)療等方向招聘上的相似,潛移默化的讓外界覺得,似乎Kimi仍然是能與DeepSeek并駕齊驅(qū)的存在。
而另一邊Minimax的遺憾,則來的更為直接。在媒體的報(bào)道中,Minimax其實(shí)更早的啟用了與DeepSeek相同的技術(shù)路線。2023年下半年,大部分國內(nèi)大模型廠商還在繼續(xù)迭代稠密模型(dense model)之際,Minimax創(chuàng)始人兼CEO閆俊杰就把80%以上的研發(fā)和算力資源,投到了一件不確定的事情上—— MoE(Mixture of Experts 混合專家模型)。
2024年1月,Minimax上線的abab6,成為國內(nèi)*MoE大模型。此后,MoE架構(gòu)徹底取代稠密架構(gòu),成了大模型領(lǐng)域技術(shù)迭代的新方向,而年初爆火出圈的DeepSeek,應(yīng)用的正是MoE。雖然無法一概而論的將兩者在此維度上進(jìn)行比較,但可以驗(yàn)證的卻是兩者間肉眼可見的落差。
客觀來說,與DeepSeek技術(shù)實(shí)力難分伯仲的Kimi與Minimax,在市場(chǎng)中早已無法得到與之匹配的影響力。
而從這個(gè)維度上來看,沒有被大廠打敗,而是被DeepSeek超越,也讓兩家在下一個(gè)周期即agent的爭(zhēng)奪中,渴望著一場(chǎng)真正意義上的翻身仗。
正如戴雨森所言“我們不是因?yàn)榇竽P屯顿YKimi,而是投資團(tuán)隊(duì)。現(xiàn)在是技術(shù)革命的早期,他們?nèi)匀皇菗碛兄袊?秀團(tuán)隊(duì)的AI創(chuàng)業(yè)公司之一,以及擁有最多資源的AI創(chuàng)業(yè)公司之一。如果我們相信AI是一件非常大的事,你有*的團(tuán)隊(duì),又有最多資源,仍然能夠做出很多有意思的事來。”而AI的下半場(chǎng),是否仍會(huì)按照當(dāng)下大廠主導(dǎo),DeepSeek重點(diǎn)突破的模式演繹,似乎仍然是一道謎題。
03
AI公司的生存邏輯正在重構(gòu)
進(jìn)入6月,AI圈似乎達(dá)到了比以往更為熱鬧的情景。羅永浩數(shù)字人直播帶貨拿下天量成交,夸克與元寶在高考報(bào)志愿競(jìng)逐,同時(shí),豆包上線了AI播客功能,美團(tuán)高層點(diǎn)了*杯AI外賣咖啡,AI的想象力與應(yīng)用正在不斷加速地滲透至生活的各個(gè)角落。
這一切的快速演變,似乎讓人看到了紅杉AI峰會(huì)中所提到的,下一輪 AI,賣的不是工具,而是收益。
但與此同時(shí),對(duì)于agent未來演變的辯論也在持續(xù)。拾象CEO李廣密曾坦言Agent與當(dāng)前模型能力的匹配程度。他認(rèn)為,今天Agent 80%的能力依賴于模型這個(gè)引擎。比如,GPT到了3.5,多輪對(duì)話的通用范式出現(xiàn)了,Chatbot這種產(chǎn)品形態(tài)就行得通了。Cursor的崛起也是因?yàn)槟P桶l(fā)展到了Claude 3.5的水平,它的代碼補(bǔ)全能力才得以成立。
而AI Research Lead鐘凱祺則認(rèn)為:通用Agent的需求基本上就是信息檢索和輕度代碼編寫這兩類,而GPT-4o已經(jīng)完成得非常好了。因此,通用Agent市場(chǎng)基本上是大模型公司的主戰(zhàn)場(chǎng),創(chuàng)業(yè)公司很難僅僅通過服務(wù)于通用需求來做大。而創(chuàng)業(yè)公司基本都聚焦在垂直(Vertical)領(lǐng)域。
回到本文的主角:當(dāng)Kimi用深度研究Agent叩開垂類專業(yè)場(chǎng)景的大門,當(dāng)Minimax以推理模型M1刷新開源能力邊界,兩家公司的每一步動(dòng)作都在印證同一個(gè)事實(shí):大模型競(jìng)爭(zhēng)早已超越 “參數(shù)比拼” 的初級(jí)階段,進(jìn)入到 “心智占領(lǐng)” 的核心戰(zhàn)場(chǎng)。
DeepSeek的崛起證明,在大廠與創(chuàng)業(yè)公司的博弈中,技術(shù)突破與市場(chǎng)定位的精準(zhǔn)耦合,足以重塑行業(yè)認(rèn)知 —— 而這正是Kimi與Minimax此刻最迫切的目標(biāo)。
從技術(shù)路徑看,Kimi押注“垂直 Agent”,試圖用“深度研究”的專業(yè)標(biāo)簽切割出差異化賽道;Minimax則試圖用線性注意力機(jī)制打出差異化,通過多模態(tài)能力構(gòu)建全場(chǎng)景滲透的想象空間。兩者的策略差異,本質(zhì)是對(duì)“AI下半場(chǎng)生存法則”的不同解讀:前者選擇在大廠尚未重兵布防的垂類扎根,用“高實(shí)用性”對(duì)抗大廠的流量?jī)?yōu)勢(shì);后者則延續(xù)“全棧布局”的野心,試圖以技術(shù)性價(jià)比彌補(bǔ)生態(tài)短板。
但這場(chǎng)爭(zhēng)奪的關(guān)鍵,或許正如戴雨森所言——“投資團(tuán)隊(duì)而非模型”。當(dāng) DeepSeek 用技術(shù)敘事改寫資本邏輯,Kimi與Minimax的核心競(jìng)爭(zhēng)力,仍在于創(chuàng)始團(tuán)隊(duì)對(duì)技術(shù)趨勢(shì)的預(yù)判能力(如楊植麟對(duì)長文本技術(shù)的堅(jiān)持、閆俊杰對(duì)MoE架構(gòu)的提前布局)。在大廠憑借資源優(yōu)勢(shì)加速內(nèi)卷的當(dāng)下,創(chuàng)業(yè)公司的破局點(diǎn)從來不是 “硬碰硬”,而是像DeepSeek那樣,在某個(gè)技術(shù)維度建立不可替代的認(rèn)知優(yōu)勢(shì),進(jìn)而占領(lǐng)用戶心智。
如今的AI下半場(chǎng),既是技術(shù)落地的“馬拉松”,也是心智認(rèn)知的“閃電戰(zhàn)”。Kimi與Minimax的每一次開源、每一個(gè)Agent的迭代,都是在為 “下一個(gè)DeepSeek” 的敘事加碼。而當(dāng)行業(yè)泡沫逐漸消散,真正能穿越周期的,或許正是那些既能在技術(shù)深水區(qū)扎根,又能在用戶心智中刻下獨(dú)特標(biāo)簽的團(tuán)隊(duì)。這場(chǎng)沒有硝煙的戰(zhàn)爭(zhēng),才剛剛開始。
參考資料:
字母榜,《閆俊杰不甘心》
字母榜,《minimax的好日子來了?》
王智遠(yuǎn),《Kimi還能找到月之亮面嗎?》
鳳凰網(wǎng)財(cái)經(jīng),《Kimi和DeepSeek又撞車?》
暗涌,《一年后,當(dāng)Kimi和MiniMax投資人再坐到一起》
極客公園,《巨頭博弈下,Agent 的機(jī)會(huì)和價(jià)值究竟在哪里?》
36氪,《開源還要IPO?MiniMax不想被遺忘在這個(gè)夏天》
月之暗面,《模型即 Agent,Kimi-Researcher(深度研究)開啟內(nèi)測(cè)》
極客公園,《MiniMax-M1 登場(chǎng),MiniMax 再次證明自己是一家模型驅(qū)動(dòng)的 AI 公司》
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...