垂類AI率先引爆行業(yè)！AI終于開始解決實際問題了

2025/03/14 15:48 雷科技

　　最近，一款名為Manus的產(chǎn)品頗受爭議。

　　Manus是什么，它怎么突然就火了?從官網(wǎng)展示的demo來看，Manus主打的是針對某場景的實際應(yīng)用，比如可以深度體驗產(chǎn)品并制作調(diào)研報告，再比如可以批量處理面試簡歷并打分排名。

　　先不管Manus的爭議如何，它的出現(xiàn)能導(dǎo)致刷屏，正好說明了AI領(lǐng)域的一個新趨勢：AI的發(fā)展不再盲目追求規(guī)模，而是開始深入挖掘?qū)嶋H價值。

　　無獨(dú)有偶，Manus智能體橫空出世后，OpenAI緊跟放大招，推出開發(fā)者工具鏈簡化智能體開發(fā)，幫助開發(fā)人員和企業(yè)構(gòu)建有用且可靠的AI智能體。OpenAI首席產(chǎn)品官凱文威爾直言：“2025年將是智能體真正發(fā)揮作用的一年。到2025年，ChatGPT將開始在現(xiàn)實世界中為你做事。”

　　這也讓我們看到了AI領(lǐng)域的一個根本性變化：過去AI追求通用的廣泛能力，現(xiàn)在則更聚焦于在特定垂直領(lǐng)域解決具體問題。

　　AI領(lǐng)域重心出現(xiàn)轉(zhuǎn)移，市場開始聚焦垂類應(yīng)用

　　這個發(fā)展路徑并不意外，從歷史上看，科技行業(yè)的變革往往遵循一定的階段性規(guī)律。以互聯(lián)網(wǎng)時代為例，最初是那些“賦能者”受益，比如半導(dǎo)體公司，然后進(jìn)入基礎(chǔ)設(shè)施的層面，包括云計算、設(shè)備和電力供應(yīng)相關(guān)的企業(yè)，最后才是應(yīng)用和服務(wù)層面，比如抖音、微信、美團(tuán)等，大部分的價值都會在應(yīng)用推廣后釋放出來。

　　這個思路放在AI時代同樣適用，通用大模型建立了基礎(chǔ)設(shè)施，最后真正實現(xiàn)AI價值的，是基于通用大模型所衍生出來的垂類模型。

　　有兩個場景可以充分證明，一是醫(yī)療行業(yè)，二是翻譯行業(yè)。

　　雖然人工智能已經(jīng)落地醫(yī)療多場景，但當(dāng)前醫(yī)學(xué)領(lǐng)域的專用垂類模型和以DeepSeek為代表的通用大模型還有很大區(qū)別。以藥物研發(fā)為例，據(jù)新華財經(jīng)報道，多家生物醫(yī)藥企業(yè)表示，當(dāng)前通用大模型對藥物研發(fā)的直接賦能仍然有限。

　　藥物研發(fā)目前還是依靠垂類模型。通用模型和垂類模型的差別主要取決于兩個方面，一個是訓(xùn)練數(shù)據(jù)源的差異，另一個是反饋機(jī)制的差異。通用模型可用數(shù)據(jù)是龐大的、易獲得的;專有模型訓(xùn)練用的數(shù)據(jù)是有較高質(zhì)量要求的、精準(zhǔn)的。

　　再以AI翻譯市場為例，不可否認(rèn)的是，對于文字轉(zhuǎn)譯這種簡單翻譯需求，其實大模型都能滿足，但具有專業(yè)難度、容錯率低的翻譯需求，卻往往會讓我們對大模型持更大的懷疑態(tài)度，在準(zhǔn)確性、專業(yè)性、安全合規(guī)性上，試錯成本太高，因此最后還是要求助專業(yè)工具。

　　即便強(qiáng)如DeepSeek，有時候也會在回答結(jié)果上進(jìn)行“思維涌現(xiàn)”，可能會出現(xiàn)在文字上生造概念，堆疊名詞，濫用修辭的現(xiàn)象。簡單來說就是會畫蛇添足。這種自作主張對某個詞語的“優(yōu)化”，在專業(yè)場景中具有致命性，特別是在重要場合，或者醫(yī)藥翻譯上，錯誤代價太高。

　　而且，DeepSeek有時候存在胡編亂造的可能，比如最典型的是在舉例的時候，很容易自己異想天開。比如以下例子，著實讓人貽笑大方。

　　圖源：DeepSeek

　　在需要精準(zhǔn)度的專業(yè)領(lǐng)域，通用大模型其引以為傲的"涌現(xiàn)能力"反而成為風(fēng)險源頭。當(dāng)技術(shù)進(jìn)入實際產(chǎn)業(yè)應(yīng)用階段時，建立精準(zhǔn)的數(shù)據(jù)和場景適配，比單純增加模型參數(shù)更有意義。

　　因此現(xiàn)在我們能夠看到的一大趨勢就是，2025年市場的焦點轉(zhuǎn)向垂類AI應(yīng)用。

　　專業(yè)工具想要擁抱AI，垂類模型是最好的選擇

　　如果說2024年的主角是通用大模型，那2025年的主角絕對是小參數(shù)的垂類模型。

　　當(dāng)業(yè)界還在熱議 DeepSeek-R1 開源戰(zhàn)略對 AI 生態(tài)的重構(gòu)、持續(xù)探討 Manus 智能 Agent 的技術(shù)突破時，國產(chǎn)大模型已在垂直賽道實現(xiàn)關(guān)鍵性跨越。

　　3 月 11 日，網(wǎng)易有道宣布完成翻譯底層技術(shù)迭代，基于自主研發(fā)的子曰翻譯大模型 2.0，在測試中實現(xiàn)翻譯質(zhì)量超越國內(nèi)外主流通用大模型，達(dá)行業(yè)第一。

　　我們也實測了一下，發(fā)現(xiàn)在很多專業(yè)領(lǐng)域的翻譯中，有道大模型翻譯確實領(lǐng)先于市面上主流的通用大模型。

　　比如兩者分別輸入：“After the 52-week trial period, patients entered a 12-week follow-up safety period during which they were no longer receiving dupilumab or placebo。”對比其翻譯結(jié)果。

　　可以看到，DeepSeek無法將“dupilumab”進(jìn)行本土化翻譯，仍是以英文的方式呈現(xiàn)，而有道詞典則是準(zhǔn)確將“dupilumab”翻譯為度普利尤單抗。

　　另外，DeepSeek把“trial period”翻譯成了“治療期”，而正確的翻譯應(yīng)該是有道詞典的“試驗期”。

　　我不確定在醫(yī)療場景下，“治療期”與“試驗期”的差別是什么，但僅從語義來看，兩者顯然會讓非醫(yī)學(xué)專業(yè)的同學(xué)產(chǎn)生誤會。

　　類似的例子還有很多，比如曾有通用大模型將臨床試驗報告中的"placebo effect"(安慰劑效應(yīng))誤譯為"愉悅效應(yīng)"，仲裁案中，法律文件里的"force majeure"(不可抗力)被譯成"主要力量";再比如某并購協(xié)議中的“joint and several liability”(連帶責(zé)任)被翻譯為“聯(lián)合與單獨(dú)責(zé)任”，引發(fā)合同雙方對責(zé)任范圍的重大誤解，最終需人工律師介入修正。

　　圖源：小紅書

　　之所以有道大模型翻譯的質(zhì)量能做到比主流通用大模型高，背后就是垂類大模型的驅(qū)動。

　　2023年7月，網(wǎng)易有道推出國內(nèi)首個教育大模型“子曰”，“子曰”大模型從一開始就定位為是一個“場景為先”的教育垂類大模型，相比于通用大模型，教育垂類大模型子曰擁有更專業(yè)的預(yù)訓(xùn)練語料，可以滿足用戶在不同場景下的學(xué)習(xí)需求。

　　目前子曰翻譯大模型已經(jīng)來到了2.0階段，這背后，有道從數(shù)據(jù)、算法和效果評估三個核心環(huán)節(jié)入手，進(jìn)行了全面的優(yōu)化和升級。

　　在數(shù)據(jù)層面，有道精心收集了并嚴(yán)格清洗了數(shù)千萬高質(zhì)量的翻譯數(shù)據(jù)，并由英語專八認(rèn)證人員及職業(yè)譯員組成的專家團(tuán)隊進(jìn)行多維度人工標(biāo)注，保證訓(xùn)練數(shù)據(jù)的高質(zhì)量。極大豐富了數(shù)據(jù)資源庫，讓模型在多樣化翻譯場景中游刃有余。

　　在算法層面，有道子曰翻譯大模型實現(xiàn)了兩大技術(shù)突破，分別是大模型融合與Online DPO。

　　簡單來說，大模型融合就是像“專家會診”一樣翻譯，相當(dāng)于有道子曰翻譯大模型如同組建了“全科專家團(tuán)”。使用大模型融合技術(shù)，通過結(jié)合不同大模型的優(yōu)勢來避免災(zāi)難性遺忘現(xiàn)象，確保模型在保持翻譯能力的同時，也不失綜合能力。

　　而Online DPO則可以理解成翻譯界的"養(yǎng)成計劃"，每次訓(xùn)練生成一優(yōu)一劣兩個譯文，讓模型學(xué)習(xí)更高質(zhì)量的譯文，通過3輪對比淘汰機(jī)制強(qiáng)化模型的判斷力，自動標(biāo)注翻譯偏好數(shù)據(jù)。經(jīng)過海選→晉級→決賽三輪嚴(yán)格篩選，最終留下的都是"全能翻譯"。

　　在評估層面，有道團(tuán)隊人工標(biāo)注了覆蓋各個領(lǐng)域的開發(fā)集和盲測集，嚴(yán)格確保了測試數(shù)據(jù)的全面性和代表性。對算法團(tuán)隊所使用的開發(fā)集和盲測數(shù)據(jù)集實行嚴(yán)格分離、相互獨(dú)立，以確保評估的客觀性與準(zhǔn)確性，模型最終效果以盲測集效果為準(zhǔn)。

　　在自動評估方面，有道不僅使用行業(yè)通用的Comet指標(biāo)，還自主研發(fā)了更精準(zhǔn)的大模型評估工具，進(jìn)一步提升了翻譯質(zhì)量檢測的可靠性。同時設(shè)計并執(zhí)行了更完善的人工評估方案，從多維度對模型的翻譯結(jié)果進(jìn)行細(xì)致地分析和評價。

　　正是通過這三個層面的全方位優(yōu)化與升級，有道用一個小參數(shù)模型就能實現(xiàn)超越通用大模型的翻譯質(zhì)量。而這樣的故事，在2025年還會涌現(xiàn)更多。

　　AI的價值，在于解決了多少實際問題

　　科技發(fā)展的核心就是解決問題�，F(xiàn)在大家越來越清楚：到2025年，各種專業(yè)領(lǐng)域的AI工具會迎來大爆發(fā)。

　　根據(jù)市場研究機(jī)構(gòu)MarketsandMarkets的最新報告，垂類AI應(yīng)用的市場規(guī)模預(yù)計將從去年51億美元大幅擴(kuò)張至2030年的大約471億美元，到2032年還可能超過1000億美元。

　　在這樣的大背景下，以有道為代表的專業(yè)翻譯工具具有標(biāo)桿意義。這場垂類AI革命給予行業(yè)的最大啟示，或許在于對技術(shù)本質(zhì)的重新認(rèn)知：AI的價值不在于參數(shù)多少，而在于解決了多少實際問題。

　　當(dāng)科技巨頭還在為"萬億俱樂部"的門票廝殺時，那些在垂直領(lǐng)域默默耕耘的“有道”們，正在用更精巧的模型、更專注的投入，撬動百倍于通用模型的實際價值。這種"少即是多"的策略，或許才是穿越AI時代的真正指南針。

　　站在2025年的技術(shù)分水嶺回望，我們會發(fā)現(xiàn)一個有趣的現(xiàn)象：當(dāng)通用大模型試圖用規(guī)模征服世界時，專業(yè)工具正在用深度重新定義邊界。其中，有道大模型翻譯就是一個將AI與實際應(yīng)用結(jié)合的極佳典范。

　　這不僅是技術(shù)的勝利，更是對產(chǎn)業(yè)規(guī)律最深刻的敬畏：在任何領(lǐng)域，專業(yè)主義永遠(yuǎn)是不可替代的稀缺品。

　　榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

午夜福利无码一区二区_亚洲欧洲美洲无码精品va_小sao货水好多真紧h无码视频_国产精品重口调教系列_免费播放片高清视频_按在桌子上糟蹋视频全部_一边吃奶一边摸做爽视频_高清无码午夜福利视频_97夜夜澡人人双人人人喊

垂類AI率先引爆行業(yè)！AI終于開始解決實際問題了

最新新聞

熱門新聞

新動態(tài)

關(guān)注度

最話題

午夜福利无码一区二区_亚洲欧洲美洲无码精品va_小sao货水好多真紧h无码视频_国产精品 重口 调教系列_免费播放片高清视频_按在桌子上糟蹋视频全部_一边吃奶一边摸做爽视频_高清无码午夜福利视频_97夜夜澡人人双人人人喊

垂類AI率先引爆行業(yè)！AI終于開始解決實際問題了

相關(guān)閱讀

最新新聞

熱門新聞

新動態(tài)

關(guān)注度

最話題

午夜福利无码一区二区_亚洲欧洲美洲无码精品va_小sao货水好多真紧h无码视频_国产精品重口调教系列_免费播放片高清视频_按在桌子上糟蹋视频全部_一边吃奶一边摸做爽视频_高清无码午夜福利视频_97夜夜澡人人双人人人喊

垂類AI率先引爆行業(yè)！AI終于開始解決實際問題了