Kimi和Minimax，爭奪「下一個DeepSeek」心智

2025/07/04 16:28 微信公眾號：科技新知　櫻木編輯丨江蘺

　　近日，在36氪WAVES 舉辦的大會上，一個有趣的環(huán)節(jié)引發(fā)了人們的熱議：主辦方讓Kimi與Minimax兩家的投資人進行了對談。

　　隨著DeepSeek的橫空出世，整個中國大模型的牌局已天翻地覆。行業(yè)龍頭的格局，從原來的大模型六小龍，逐漸演變成了今天的基模五強。

　　當六小龍不再是市場的焦點時，安靜很久的Kimi和Minimax在前不久不約而同有了新動作：Kimi開源了編程模型Kimi-Dev，它的*個Agent Kimi-Researcher深度研究也開啟小范圍測試。而Minimax則開源了*推理模型Minimax-M1，并完成連續(xù)五天包含大模型、視頻生成、音頻生成等多個方向的更加。

　　從產(chǎn)品側來看，Kimi將重心聚焦到agent，以深度研究為主要方向，似乎有意向金融、學術等方向發(fā)力，這條路線雖然已經(jīng)有了智譜等競爭者，但遠離了以生活服務為主的大廠射程，疊加原本不錯的基礎模型能力，Kimi似乎找到了自己的舒適區(qū)。

　　而另一邊，Minimax則似乎想要彌補自身的遺憾，在沒有接入DeepSeek之后，繼續(xù)發(fā)力全方向的布局。

　　這似乎也意味著，大模型競爭進入下半場之后，更多的變量正在醞釀之中，而從各項評測來看，Kimi與Minimax的新產(chǎn)品，似乎都有著不錯的效果。

　　在沒等來R2之后的緩沖期，六小龍中的代表們，正在試圖攜帶著各自的大招，開啟下半場。而從報道來看，無論是頻繁與DeepSeek撞論文的Kimi，還是曾經(jīng)和DeepSeek賭同一個技術路徑的Minimax，似乎都帶著一絲不甘心。

　　而在大廠先后加入大模型賽道后，六小龍中，Kimi和Minimax正試圖找到自己的生存方式。從某種程度來說，競爭的模式正在發(fā)生改變，而在泡沫消散之后，越來越懂經(jīng)營的六小龍們，也在期待著下一個周期的開始。

　　Kimi和Minimax接連放大招

　　“一年前，就是比投放、比用戶，現(xiàn)在則回到技術前沿，回到強認知，我相信反而更適合以技術大牛為核心的創(chuàng)業(yè)團隊。因為比投放，其實是大廠的機會，所以我覺得他們狀態(tài)還挺好的。”在這次對談上，真格基金合伙人戴雨森在談到Kimi與Minimax時如是說。

　　正如其所言，近日，相較于在教育、醫(yī)療等垂類應用場景中爭奪的大廠，Kimi與Minimax似乎更希望在基礎技術上展現(xiàn)自身的底色。

　　6月20日，Kimi官方發(fā)布消息，Kimi-Researcher(深度研究)，開始小范圍灰度測試。據(jù)官方消息透露，模型即Agent，Kimi-Researcher 是基于端到端自主強化學習(end-to-end agentic RL)技術訓練的新一代Agent模型，也是一個專為深度研究任務而生的Agent產(chǎn)品。

　　做為內測用戶，可以看到的是，Kimi這次試圖去打造的就是“高實用性”以及“靠譜”的產(chǎn)品。

　　按照官方的數(shù)據(jù)，每個任務平均進行23步推理，自主梳理并解決需求，平均規(guī)劃74個關鍵詞，找到206個網(wǎng)址，由模型判斷并篩選出信息質量最高的前3.2%內容，剔除冗余、低質信息。報告的平均長度在萬字以上，平均引用約26個高質量、可溯源的信源。

　　很明顯，Kimi此次直指需要低幻覺類的垂類賽道。從小紅書等社交媒體反饋來看，論文黨、甚至如金融、法律等高頻需要深度探索的方向，都對Kimi-researcher有著不錯的評價。

　　專業(yè)評測博主mactalk評價道：深度研究不算什么新創(chuàng)新，但Kimi生成的內容，在信源和形式上確實不錯，Kimi的深度研究功能，除了給到一份分析報告外，還會生成一個網(wǎng)頁�？吹骄W(wǎng)頁的那刻，給人的感受是，網(wǎng)頁也應該成為一種和文本同等重要的交互方式。

　　與此同時，Minimax也用全新的模型在展示自身的肌肉。根據(jù)極客公園報道，作為推理模型，Minimax-M1在長上下文理解能力上，是目前包括所有閉源和開源模型在內，能力全球前二的模型，且在訓練和推理成本上有極高的性價比。

　　M1仍然延續(xù)著MoE架構，而在注意力機制上和強化學習算法上的創(chuàng)新讓M1鮮明地區(qū)別于其他推理模型。模型總參數(shù)達到4560億參數(shù)，原生支持100萬token的上下文長度輸入，以及目前所有模型中最長的80ktoken的輸出長度。

　　在專業(yè)上下文能力的測評中，M1的表現(xiàn)遠超包括DeepSeek-R1-0528和Qwen3-235B在內的所有開源模型，甚至超越OpenAI o3和Claude 4 Opus，僅小幅落后SOTA的Gemini 2.5 Pro。

　　除了基礎模型的進展，Minimax在agent以及多模態(tài)等多個領域也是亮點頻出。“大家最近刷抖音有沒有看到‘吳彥祖教你學英語’?其實是Minimax在提供背后的技術支持。我*次聽的時候，也難以分辨到底是真人還是AI，直到后來才知道是Minimax的客戶，感嘆這真的挺厲害的。”云啟資本合伙人陳煜提到。

　　實用性*的agent，能力出眾的大模型，Kimi和Minimax試圖開啟的是一場全方位的競速，而從更深層次上來看，兩家公司更希望表達的則是，打破大眾對于大模型賽道的固有心智。

　　渴望一場

　　DeepSeek式的勝利

　　相較于DeepSeek的光芒萬丈，不得不說，此刻回頭來看，Kimi與Minimax是兩家曾充滿遺憾的公司。

　　楊植麟清華出身，同時在卡內基梅隆大學(CMU)語言技術研究所(LTI)讀博，導師是蘋果AI負責人Ruslan Salakhutdinov和Google AI首席科學家William W. Cohen，這樣的學術背景，在技術可信度上遠超普通創(chuàng)業(yè)者。

　　而且他在循環(huán)智能等方面的創(chuàng)業(yè)經(jīng)歷，已經(jīng)在企業(yè)級AI落地方面證明過自己。這更能讓資本相信，這個人不只是懂技術，還會做生意。高頻快速的融資，讓其估值迅速爬升。

　　技術背景，管理經(jīng)驗，同時具有大量子彈，這讓楊植麟成為前DeepSeek時代的明星。

　　更重要的是，Kimi的*仗還打的漂亮，把長文本技術提升到了“中國AGI突破口”的高度，精準匹配了資本對其的期待。

　　但不可否定的是，DeepSeek的爆火，一定程度上掩蓋了Kimi的部分聲量。

　　不過，即便是到當下，仍然可以看出，Kimi在技術實力上，仍然不遜于DeepSeek。在基礎研究環(huán)節(jié)，2月18日，DeepSeek和月之暗面幾乎同時發(fā)布了他們各自最新的論文，而主題直接「撞車」—— 都是挑戰(zhàn)Transformer架構最核心的注意力機制，讓它能更高效的處理更長的上下文。而更有趣的是，兩家公司的技術派明星創(chuàng)始人的名字，出現(xiàn)在各自的論文和技術報告里。

　　而在近日，兩者撞車的事件又頻頻發(fā)生。在法律、醫(yī)療等方向招聘上的相似，潛移默化的讓外界覺得，似乎Kimi仍然是能與DeepSeek并駕齊驅的存在。

　　而另一邊Minimax的遺憾，則來的更為直接。在媒體的報道中，Minimax其實更早的啟用了與DeepSeek相同的技術路線。2023年下半年，大部分國內大模型廠商還在繼續(xù)迭代稠密模型(dense model)之際，Minimax創(chuàng)始人兼CEO閆俊杰就把80%以上的研發(fā)和算力資源，投到了一件不確定的事情上—— MoE(Mixture of Experts 混合專家模型)。

　　2024年1月，Minimax上線的abab6，成為國內*MoE大模型。此后，MoE架構徹底取代稠密架構，成了大模型領域技術迭代的新方向，而年初爆火出圈的DeepSeek，應用的正是MoE。雖然無法一概而論的將兩者在此維度上進行比較，但可以驗證的卻是兩者間肉眼可見的落差。

　　客觀來說，與DeepSeek技術實力難分伯仲的Kimi與Minimax，在市場中早已無法得到與之匹配的影響力。

　　而從這個維度上來看，沒有被大廠打敗，而是被DeepSeek超越，也讓兩家在下一個周期即agent的爭奪中，渴望著一場真正意義上的翻身仗。

　　正如戴雨森所言“我們不是因為大模型投資Kimi，而是投資團隊�，F(xiàn)在是技術革命的早期，他們仍然是擁有中國*秀團隊的AI創(chuàng)業(yè)公司之一，以及擁有最多資源的AI創(chuàng)業(yè)公司之一。如果我們相信AI是一件非常大的事，你有*的團隊，又有最多資源，仍然能夠做出很多有意思的事來。”而AI的下半場，是否仍會按照當下大廠主導，DeepSeek重點突破的模式演繹，似乎仍然是一道謎題。

　　AI公司的生存邏輯正在重構

　　進入6月，AI圈似乎達到了比以往更為熱鬧的情景。羅永浩數(shù)字人直播帶貨拿下天量成交，夸克與元寶在高考報志愿競逐，同時，豆包上線了AI播客功能，美團高層點了*杯AI外賣咖啡，AI的想象力與應用正在不斷加速地滲透至生活的各個角落。

　　這一切的快速演變，似乎讓人看到了紅杉AI峰會中所提到的，下一輪 AI，賣的不是工具，而是收益。

　　但與此同時，對于agent未來演變的辯論也在持續(xù)。拾象CEO李廣密曾坦言Agent與當前模型能力的匹配程度。他認為，今天Agent 80%的能力依賴于模型這個引擎。比如，GPT到了3.5，多輪對話的通用范式出現(xiàn)了，Chatbot這種產(chǎn)品形態(tài)就行得通了。Cursor的崛起也是因為模型發(fā)展到了Claude 3.5的水平，它的代碼補全能力才得以成立。

　　而AI Research Lead鐘凱祺則認為：通用Agent的需求基本上就是信息檢索和輕度代碼編寫這兩類，而GPT-4o已經(jīng)完成得非常好了。因此，通用Agent市場基本上是大模型公司的主戰(zhàn)場，創(chuàng)業(yè)公司很難僅僅通過服務于通用需求來做大。而創(chuàng)業(yè)公司基本都聚焦在垂直(Vertical)領域。

　　回到本文的主角：當Kimi用深度研究Agent叩開垂類專業(yè)場景的大門，當Minimax以推理模型M1刷新開源能力邊界，兩家公司的每一步動作都在印證同一個事實：大模型競爭早已超越 “參數(shù)比拼” 的初級階段，進入到 “心智占領” 的核心戰(zhàn)場。

　　DeepSeek的崛起證明，在大廠與創(chuàng)業(yè)公司的博弈中，技術突破與市場定位的精準耦合，足以重塑行業(yè)認知 —— 而這正是Kimi與Minimax此刻最迫切的目標。

　　從技術路徑看，Kimi押注“垂直 Agent”，試圖用“深度研究”的專業(yè)標簽切割出差異化賽道;Minimax則試圖用線性注意力機制打出差異化，通過多模態(tài)能力構建全場景滲透的想象空間。兩者的策略差異，本質是對“AI下半場生存法則”的不同解讀：前者選擇在大廠尚未重兵布防的垂類扎根，用“高實用性”對抗大廠的流量優(yōu)勢;后者則延續(xù)“全棧布局”的野心，試圖以技術性價比彌補生態(tài)短板。

　　但這場爭奪的關鍵，或許正如戴雨森所言——“投資團隊而非模型”。當 DeepSeek 用技術敘事改寫資本邏輯，Kimi與Minimax的核心競爭力，仍在于創(chuàng)始團隊對技術趨勢的預判能力(如楊植麟對長文本技術的堅持、閆俊杰對MoE架構的提前布局)。在大廠憑借資源優(yōu)勢加速內卷的當下，創(chuàng)業(yè)公司的破局點從來不是 “硬碰硬”，而是像DeepSeek那樣，在某個技術維度建立不可替代的認知優(yōu)勢，進而占領用戶心智。

　　如今的AI下半場，既是技術落地的“馬拉松”，也是心智認知的“閃電戰(zhàn)”。Kimi與Minimax的每一次開源、每一個Agent的迭代，都是在為 “下一個DeepSeek” 的敘事加碼。而當行業(yè)泡沫逐漸消散，真正能穿越周期的，或許正是那些既能在技術深水區(qū)扎根，又能在用戶心智中刻下獨特標簽的團隊。這場沒有硝煙的戰(zhàn)爭，才剛剛開始。

　　參考資料：

　　字母榜，《閆俊杰不甘心》

　　字母榜，《minimax的好日子來了?》

　　王智遠，《Kimi還能找到月之亮面嗎?》

　　鳳凰網(wǎng)財經(jīng)，《Kimi和DeepSeek又撞車?》

　　暗涌，《一年后，當Kimi和MiniMax投資人再坐到一起》

　　極客公園，《巨頭博弈下，Agent 的機會和價值究竟在哪里?》

　　36氪，《開源還要IPO?MiniMax不想被遺忘在這個夏天》

　　月之暗面，《模型即 Agent，Kimi-Researcher(深度研究)開啟內測》

　　極客公園，《MiniMax-M1 登場，MiniMax 再次證明自己是一家模型驅動的 AI 公司》

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

　　榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報生成中...

分享到微博分享到微信一鍵復制

標題鏈接已成功復制

Kimi和Minimax，爭奪「下一個DeepSeek」心智

最新新聞

熱門新聞

新動態(tài)

關注度

最話題

Kimi和Minimax，爭奪「下一個DeepSeek」心智

相關閱讀

最新新聞

熱門新聞

新動態(tài)

關注度

最話題