產業(yè)大模型剛開卷，京東跑進“最后半公里”

2023/07/17 16:47 光錐智能

　　文|姚悅編|王一粟

　　百模大戰(zhàn)，到了真正的亮劍時刻。

　　“京東一直在探索哪些產品、技術、場景可以真正把大模型用起來，在我們內部的場景中反復驗證后，才決定在7月份對外發(fā)布，現在我們在零售、健康、物流、金融等業(yè)務場景里已經積累了一些經驗。”京東集團技術委員會主席、京東云事業(yè)部總裁曹鵬在群訪中，對光錐智能表示。

　　大模型火熱半年，自2月官宣聚焦“產業(yè)大模型”后，一直相對低調的京東，也終于展示了自己的言犀大模型。但與此同時，大模型的競爭已經趨于白熱化。據不完全統(tǒng)計，當前國內已發(fā)布超過80個大模型產品，并已經開始對應不同行業(yè)、不同應用場景頻繁發(fā)力。

　　究竟什么樣的大模型，才能在這番激烈的競爭中突出重圍?

　　一方面，大模型亟需尋找到場景快速落地，另一方面，中國實體產業(yè)需要技術驅動來降本增效。

　　于是，從產業(yè)中來，到產業(yè)中去，就成了京東大模型自然的選擇。

　　“大模型，讓技術幫助產業(yè)降本增效的可能性成倍遞增。”京東集團CEO許冉認為，從產業(yè)切入大模型，如同從北坡攀爬技術珠峰。道路雖然更加艱難，卻有更波瀾壯闊的風景。

　　長于產業(yè)的大模型

　　“言犀大模型訓練時，融合70%的通用數據與30%數智供應鏈原生數據”，IEEE Fellow、京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬告訴光錐智能。

　　這種大模型訓練方式，與此前業(yè)界早期普遍認為的并不相同。

　　“目前，基礎模型有三種不同的應用模式：第一種是通用基礎模型訓練好后，遷移至行業(yè)基礎模型中，進而做產業(yè)(垂直)應用;第二種是通用基礎模型進行微調;第三種，則是利用通用大模型+‘知識庫和搜索引擎’。”業(yè)內人士道。

　　由于前兩種的訓練成本偏高，且用于通用大模型訓練的公開數據“噪聲”過大，容易出現錯誤、謠言、偏見等問題，以至于讓AI 存在“幻覺”“一本正經的胡說八道”，無法保障內容真實可信，進而阻礙大模型落地行業(yè)。

　　近期，從OpenAI到國內部分公司，都開始偏向第三種應用路徑，而京東也正是走的這條路。“知識庫+搜索引擎”，大致可以理解為是產業(yè)(垂類)領域的向量數據庫，這樣的向量數據庫與通用大模型結合，被業(yè)界稱之為“黃金搭檔”。

　　通過這樣的路徑，“言犀大模型一開始就既具備常識，又具備專業(yè)性。相當于是既做了通識教育，又做了四年本科教育”，何曉冬形象地描述言犀大模型的差異性。

　　京東找到這樣的路徑，并不是偶然。

　　從事AIGC領域研究20余年的何曉冬，在2020年開始通過注意力機制、深度學習、Transformer 生成文檔、文案，他注意到，用大語言模型直接生成的文案、文字和報告總會出現一些“胡說八道”“玄幻”的現象。

　　于是，何曉冬和團隊提出了知識注入的預訓練語言模型(K-Plug)，并于2021年發(fā)布了相關論文。“京東內部用上更早一點”，何曉冬說，通過K-Plug，讓Transformer和行業(yè)知識結合，讓生成式語言模型的內容生成正確率從83%、85%左右，直接提升到95%以上，才能達到商用程度。

　　“83%的正確率在to C 用戶的聊天中，也可以接受。但是，商用是不可接受的。”何曉冬提到。

　　GPT能出現智能涌現，依靠的不是數據，而是文本數據中的知識。所以，相比一味的追求超大參數量，數據中的“知識”含量更為重要。

　　基于20年的行業(yè)“知識”積累，京東言犀可以說是“長”在了數智供應鏈上。

　　供應鏈是產業(yè)中數據最集中、結構最復雜、相關度最密切的環(huán)節(jié)。在零售、物流，到健康、保險、工業(yè)等場景中，京東沉淀了從采購、分銷、交易、物流等產業(yè)鏈條中的巨量數據，并且每天還會源源不斷產生大量“活”的交互數據。

　　在行業(yè)中長期積累的“知識”，保障了大模型的可信，極大的幫助大模型落地。

　　“只有自己的場景才能培養(yǎng)適合自己的大模型應用”，京東集團副總裁、京東科技產品與解決方案總裁高禮強如此說道。

　　30%的京東數智供應鏈數據，訓練出了產業(yè)可用的大模型，而大模型在應用過程中要落地，還需要在具體場景中繼續(xù)打磨。

　　在場景中歷練，算法與數據的飛輪

　　“大模型不是我們的目標，而是(產業(yè)服務的)工具。”曹鵬表示，大模型不能只用來聊天、畫畫、吟詩作賦，最終還是要在產業(yè)中創(chuàng)造價值。

　　所以，在語言大模型火熱的半年里，京東選擇了埋頭摸索和嘗試，讓大模型先在京東的多項業(yè)務中歷練。

　　由于AIGC在生成和交互中表現優(yōu)異，所以在京東健康中落地較快。

　　在京東健康的諸多業(yè)務流程中，大模型首先在AI問診中落地。用戶輸入“我可以吃阿司匹林嗎?”的訴求后，接下來在AI的引導下，通過多輪對話逐步判斷病因，給出診斷、用藥參考，并進行生活建議，醫(yī)療風險提示。

　　這就是在言犀大模型3.0的基礎上，通過醫(yī)療知識和經驗訓練的“慧醫(yī)千詢”大模型，在現場輔助診療場景下的具體表現。這背后，是京東健康累計線上問診數據2.8億，超3千萬高質量臨患對話，140余科室醫(yī)療專家等數據積累。

　　如果是一般通用大模型，在遇到患者問題時，更傾向于直接把答案給出。“但是在實際的醫(yī)療場景下，是需要多輪對話，才能更深入了解用戶病史信息，這樣才能給出更適合用戶自身特點的方案。”京東集團副總裁、京東健康技術產品部負責人李欣表示。

　　醫(yī)療是和百姓生活息息相關一個行業(yè)，其中存在一個著名的“不可能三角”，即醫(yī)療服務不可能同時實現高質量、高覆蓋、低成本，這本質上是由于優(yōu)質醫(yī)療資源的供給不足造成。

　　“慧醫(yī)千詢”的出現，目標就是通過遠程醫(yī)療全流程方案，解決這個“不可能三角”。

　　李欣透露，“慧醫(yī)千詢”重點會做兩個核心場景，“首先是藥師的問答，這個非常專業(yè)化、具體，是醫(yī)療大模型最容易發(fā)揮作用的地方，AI自動化可以省去90%的人工工作量。再在這個基礎上，推全場景醫(yī)患問答。”

　　除了京東健康，大模型在京東物流、零售等方面也大展拳腳。

　　“電商的產品視頻、照片直接由人去拍攝非常貴，少則幾百塊，多則幾千塊。”京東集團副總裁、京東科技產品與解決方案總裁高禮強表示，AIGC可以極大的降低商品營銷的成本。

　　目前，基于言犀的AIGC內容營銷平臺，已經能很好地理解商品特征，自動幫助商家生成商品圖片、賣點等營銷素材。以每套圖為例，成本降低90%，周期從7天縮短到半天。

　　通過對營銷的理解，以及用戶運營經驗的持續(xù)積累，大模型解決了諸如關鍵性任務，動態(tài)適應性、用戶體驗等問題。本次發(fā)布的AI增長營銷平臺是京東科技市場和平臺運營團隊依托日常的金融營銷工作結合大模型應用的探索，能大幅優(yōu)化了營銷運營流程，降低運營人員的學習成本與操作成本，實現方案生產效率上百倍提高。將過去涉及產品/研發(fā)/算法/設計/分析師等5類以上職能才能完成的流程，壓縮至1人。同時，一個入口的全新交互模式，讓人機交互次數從2000次降低至少于50次，將操作效率提升了超過40倍。

　　另外，數字人在主播方面的落地也是行業(yè)熱點，基于京東在電商領域知識增強模型K-PLUG，僅需在直播后臺上傳商品鏈接，數字人就能“閱讀”商品詳情，找到關鍵的規(guī)格、賣點等信息，并自動生成真實、生動、可閱讀性強的直播文案。

　　例如，商家原先寫出50個SKU的直播腳本需要至少五小時，使用K-PLUG模型只需要“一鍵生成”。目前K-PLUG商品文案寫作能力已經覆蓋3000多個京東的品類，累計生成文案30多億字。

　　通過上面場景就可以看到，大模型在產業(yè)(垂類)場景中的降本增效非常明顯。

　　當大模型在海量具體場景中使用時，人類真實反饋就會讓數據和算法的形成飛輪效應。這期間，高質量數據不斷生成，垂直行業(yè)的智能涌現才有可能出現。

　　為了支撐大模型在場景中的歷練，京東需要不斷在產品和算力方面提升能力。產品方面，日前，京東將積累高質量行業(yè)數據的兩個平臺——數智平臺優(yōu)加DaaS和言犀智能服務都已升級到了3.0版本，進一步提升了交互能力，以及更好地將數據用起來;算力方面，已經布局了全國首個基于SuperPOD架構的超大規(guī)模計算集群——天琴α，算力總規(guī)模達到135TFLOPS(每秒浮點運算次數)。

　　六年AI路，三年大模型

　　種樹最好的時間是在十年前。

　　在大模型突然爆火之前，京東很早已經開始“栽樹”。

　　“技術、技術、技術”，2017年初，京東開始全面向 AI 技術轉型。

　　第一個技術，主要用于解決內部大規(guī)模人力帶來的效率問題;第二個技術，是組件化、模塊化的技術服務對外輸出;第三個技術，則是對前沿技術進行探索和有秩序地創(chuàng)新。

　　2017年底，京東在人工智能的布局就開始落地，一方面聚集團隊，通過人才、研究、專利等打造技術護城河;但與此同時，京東也一直在思考一個問題——怎樣將這些技術落地產生閉環(huán)的商業(yè)價值和產品價值?

　　2018年，人工智能領域科學家何曉冬正式加入京東。2020年，何曉冬團隊就開始關注如何利用深度學習的模型。2021年京東開始組建大模型團隊，探索深度學習及語音和語言技術在新興領域等應用場景的落地。

　　早在2022年，京東就推出了百億參數的大模型Vega。但直到今年上半年ChatGPT大火，京東雖然在2月份宣布要做服務產業(yè)的大模型，但遲遲沒有對外公布。

　　“百模大戰(zhàn)”白熱化升級，外界都替京東著急了。“有無數的朋友，最近都會跑過來問我，你們京東有沒有大模型?什么時候發(fā)大模型?”曹鵬在2023京東全球科技探索者大會暨京東云峰會上打趣道。

　　但這背后，其實回到一個很嚴肅的問題上，就是京東最初就思考的那個問題——技術的價值，也可以說成是大模型的價值。

　　“大模型本身是沒有辦法直接產生價值的，只有放到場景里才能夠產生實際的價值。”曹鵬說，“在京東我們真正講大模型本身會比較少，更多會講在產業(yè)里面、場景里面，怎么能夠利用新的技術帶來產業(yè)變化，真的給產業(yè)不斷提升效率、改善體驗、降低成本，這才是一個技術真正核心的價值所在。”

　　關于大模型，京東制定了“三步走”戰(zhàn)略。第一步，基于內部實踐構建言犀大模型和言犀AI開發(fā)計算平臺;第二步，在零售、金融、健康、物流等京東內部高復雜場景大規(guī)模錘煉，并針對重點場景的標桿客戶進行對外服務，主要目的是發(fā)現那些看起來“不起眼”，但產業(yè)應用中又非常關鍵的問題;第三步，針對嚴肅商業(yè)場景將大模型能力對外開放。

　　今年上半年，京東大模型走過了第一步，并在第二個階段有了初步嘗試，處于在第二個階段的深化和逐步向第三步邁進的狀態(tài)。

　　大模型不是一天能煉成的。

　　在 ChatGPT 證明 AGI(通用人工智能)的可能性之前，AI技術長期面臨著技術突破遙遙無期、商業(yè)落地困難等問題，甚至AI行業(yè)自己也一度質疑過人工智能的價值。

　　但在今年光錐智能觀察到一個現象，就是：

　　人工智能，已經不再是獨立的人工智能實驗室，而是泛化到所有業(yè)務當中。

　　當 AI 離開實驗室，才是價值綻放的開始。

　　京東對大模型的價值，有自己的理解。許冉在峰會上提出，“大模型的價值=算法×算力×數據×產業(yè)厚度的平方”的公式，她強調，當產業(yè)效率和產業(yè)的邊界得到質的提升后，大模型才有了更重要的實際價值和意義，將不亞于又一次工業(yè)革命。

IT產業(yè)網微信二維碼logo

　　榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報生成中...

分享到微博分享到微信一鍵復制

標題鏈接已成功復制

產業(yè)大模型剛開卷，京東跑進“最后半公里”

最新新聞

熱門新聞

新動態(tài)

關注度

最話題

產業(yè)大模型剛開卷，京東跑進“最后半公里”

相關閱讀

最新新聞

熱門新聞

新動態(tài)

關注度

最話題

產業(yè)大模型剛開卷，京東跑進“最后半公里”