大模型得寵智能駕駛乘風(fēng)

2023/10/20 11:19 新立場(chǎng)

　　2023年10月17日，百度世界大會(huì)2023在北京首鋼園舉行。創(chuàng)始人李彥宏以“歡迎來(lái)到生成式人工智能的時(shí)代”開(kāi)場(chǎng)，發(fā)表了主題為《手把手教你做AI原生應(yīng)用》的演講。作為大模型浪潮正式到來(lái)后的首次世界大會(huì)，這屆的主題被百度定為“生成未來(lái)”。發(fā)布會(huì)上首先亮相的產(chǎn)品，便是重磅的文心大模型4.0版本。相較于7個(gè)月前初次發(fā)布文心一言時(shí)坦誠(chéng)的提到“不夠完美”“承認(rèn)差距”，臺(tái)上的Robin這次顯然更加從容自信：

　　“這是我們認(rèn)為迄今為止最強(qiáng)大的文心大模型，它的基礎(chǔ)模型實(shí)現(xiàn)了全面升級(jí)，在理解、生成、邏輯、記憶這四大能力上，相比于大家現(xiàn)在用的線上的文心一言版本是有明顯提升的，綜合水平跟GPT4相比也已經(jīng)毫不遜色。”

　　從現(xiàn)場(chǎng)的演示看，文心大模型4.0版本的確涌現(xiàn)出了相當(dāng)高的智能水平。李彥宏扮演了一個(gè)“刁蠻”的測(cè)試用戶，向其詢問(wèn)到“我想回承德買(mǎi)房，能用公積金貸款嗎，手續(xù)怎么辦?我在北京工作。”而文心大模型4.0的回答表明，即便面對(duì)這類(lèi)涉及亂序表述、模糊意圖乃至潛臺(tái)詞的問(wèn)題，它應(yīng)對(duì)起來(lái)依舊游刃有余。

　　基于全新的文心大模型核心能力，百度在過(guò)去幾個(gè)月里，對(duì)集團(tuán)內(nèi)部的幾乎所有產(chǎn)品做了重構(gòu)，即李彥宏說(shuō)的“手把手教你做AI原生應(yīng)用”。最核心的百度搜索在大模型加持下，已經(jīng)具備極致滿足、推薦激發(fā)、多輪交互三個(gè)特點(diǎn)。百度產(chǎn)品矩陣中的擔(dān)當(dāng)角色，如地圖、網(wǎng)盤(pán)、文庫(kù)等在重構(gòu)后革新了用戶體驗(yàn)。而像國(guó)內(nèi)首個(gè)生成式商業(yè)智能產(chǎn)品“百度GBI”和“如流”這類(lèi)新一代智能工作平臺(tái)，則顯示出“AI原生”這個(gè)新要素在生產(chǎn)力方面所能創(chuàng)造的巨大價(jià)值。

　　當(dāng)然，百度自動(dòng)駕駛基于大模型的新進(jìn)展，也在這次會(huì)議上向外界做了展示。目前，百度蘿卜快跑訂單總量已超過(guò)400萬(wàn)單，是全球最大的自動(dòng)駕駛出行服務(wù)商。百度集團(tuán)資深副總裁、智能駕駛事業(yè)群組總裁李震宇以視頻方式做了演示，他在機(jī)場(chǎng)打了一輛蘿卜快跑的“真無(wú)人車(chē)”，車(chē)輛在繁華復(fù)雜的城市道路上穿梭自如，并最終順利達(dá)到目的地，引發(fā)現(xiàn)場(chǎng)一陣驚嘆。

　　相較于上面提到的這些互聯(lián)網(wǎng)應(yīng)用，自動(dòng)駕駛跟大模型的結(jié)合有著特別的意義，因?yàn)樗笳髦竽Ｐ蛯?duì)世界的重構(gòu)從信息空間拓展到了物理空間。如李彥宏所說(shuō)，大模型將會(huì)讓百度的自動(dòng)駕駛能力超越經(jīng)驗(yàn)系統(tǒng)，更聰明處理復(fù)雜場(chǎng)景，實(shí)現(xiàn)更廣泛的時(shí)空覆蓋。

　　01、自動(dòng)駕駛長(zhǎng)腦子

　　李想國(guó)慶假期前的最后一周，拉著王興和陸奇等人開(kāi)了場(chǎng)秋季戰(zhàn)略會(huì)。這場(chǎng)戰(zhàn)略會(huì)上，智能駕駛被提到了空前高度，這群人單獨(dú)花了一整天來(lái)討論智駕要如何投入。李想本人在會(huì)上做了某種意義上的自我批評(píng)，他認(rèn)為智駕應(yīng)該提前半年投入，也就是從去年中，而不是今年初才開(kāi)始上強(qiáng)度。

　　這個(gè)判斷有著充足的現(xiàn)實(shí)素材做支撐。L2級(jí)自動(dòng)駕駛在去年底已經(jīng)成為標(biāo)配，而具備高速點(diǎn)對(duì)點(diǎn)和NOA的高階智能駕駛能力將在2025年達(dá)到15%以上的搭載率。從乘聯(lián)會(huì)發(fā)布的乘用車(chē)價(jià)格段市場(chǎng)結(jié)構(gòu)看，這個(gè)比例幾乎涵蓋了價(jià)格在25萬(wàn)以上的所有車(chē)型。相對(duì)應(yīng)的，2025年智能駕駛在所有購(gòu)車(chē)因素中的決策占比也將從過(guò)去的不到2%快速增長(zhǎng)到超過(guò)30%。所以對(duì)于車(chē)企而言，尤其是瞄準(zhǔn)中高端市場(chǎng)的廠商，智能駕駛是個(gè)做了不一定能活到最后，但不做一定立馬就死的必選項(xiàng)。

　　這個(gè)過(guò)程中，基于大模型的生成式AI技術(shù)將扮演關(guān)鍵的催化劑角色。具體來(lái)講，可以大致分成兩個(gè)層面。

　　一是由于大模型具有理解、生成、推理、記憶的能力，它將完全重塑智能座艙的體驗(yàn)，“使得智能座艙內(nèi)人的體驗(yàn)徹底變?yōu)槿撕吞摂M人之間的一個(gè)全新關(guān)系”。未來(lái)人跟汽車(chē)的交互將從現(xiàn)在基于圖形界面的GUI模式，轉(zhuǎn)向更符合人類(lèi)通過(guò)語(yǔ)言交流的LUI模式。在兩年前的世界大會(huì)上，百度首次提出了“汽車(chē)機(jī)器人”的前瞻概念，而隨著大模型在智能座艙上面的普遍應(yīng)用，這個(gè)概念正在一步步變得具象和現(xiàn)實(shí)。

　　因此，在文心大模型的基礎(chǔ)上，結(jié)合百度對(duì)于智能汽車(chē)的理解以及過(guò)去多年在領(lǐng)域內(nèi)累積的人機(jī)交互數(shù)據(jù)，IDG進(jìn)一步迭代出了智艙大模型。在具備文心大模型智力的同時(shí)，跟出行場(chǎng)景和車(chē)內(nèi)環(huán)境做了深度融合。OEM廠商通過(guò)官方提供的智艙開(kāi)發(fā)工具鏈，可以非常方便地打造帶有車(chē)企自身特色的下一代導(dǎo)航、交互、信息服務(wù)、用車(chē)場(chǎng)景等一系列的智艙原生應(yīng)用。百度智能駕駛事業(yè)群組智能汽車(chē)業(yè)務(wù)部總經(jīng)理蘇坦在論壇上的描述，就是“通用大模型、行業(yè)大模型和品牌大模型，是讓用戶體驗(yàn)變得越來(lái)越好的三級(jí)火箭。”

　　在智能座艙之外，大模型還將對(duì)自動(dòng)駕駛技術(shù)本身帶來(lái)躍進(jìn)，百度稱(chēng)之為智駕或者視覺(jué)大模型。最近一段時(shí)間，國(guó)內(nèi)自動(dòng)駕駛行業(yè)最重要的一波技術(shù)潮流，就是車(chē)企紛紛轉(zhuǎn)型基于BEV+Transformer的純視覺(jué)路線。

　　在此之前，智能駕駛系統(tǒng)實(shí)際是以傳統(tǒng)的組件堆砌方式實(shí)現(xiàn)的。例如在感知領(lǐng)域，不同的小模型負(fù)責(zé)不同的功能，然后這些小模型組合在一起形成一個(gè)系統(tǒng)。例如，車(chē)道線的檢測(cè)、紅綠燈的檢測(cè)和障礙物的檢測(cè)都由各自的小模型實(shí)現(xiàn)。但這種方式顯然會(huì)給數(shù)據(jù)搜集和系統(tǒng)智能化的組合帶來(lái)問(wèn)題。

　　規(guī)劃控制方面也類(lèi)似，過(guò)去是基于規(guī)則和經(jīng)驗(yàn)的系統(tǒng)，就是說(shuō)提供一些預(yù)定義的規(guī)則或者訓(xùn)練系統(tǒng)時(shí)喂給它不同的場(chǎng)景，讓系統(tǒng)知道后續(xù)再次遇到類(lèi)似場(chǎng)景應(yīng)該如何做。這樣做帶來(lái)了兩個(gè)問(wèn)題，首先是有些場(chǎng)景下你很難把規(guī)則說(shuō)清楚。比如10月4號(hào)，清華、港大和UCB的研究人員就在arXiv上剛剛發(fā)表了一篇論文。他們舉了個(gè)例子，如果前面的路口沒(méi)有交通信號(hào)燈，而正駕駛車(chē)輛打算左轉(zhuǎn)的你，迎面來(lái)了一輛直行車(chē)輛。這種情況下，熟悉交通規(guī)則的人類(lèi)駕駛員直覺(jué)上就知道要減速讓行，但現(xiàn)有的高級(jí)自動(dòng)駕駛系統(tǒng)卻往往需要設(shè)計(jì)極其復(fù)雜的規(guī)則或者獎(jiǎng)懲函數(shù)才能有效處理類(lèi)似場(chǎng)景。

　　其次是很難處理corner case，因?yàn)楦哳l剛需的場(chǎng)景會(huì)給系統(tǒng)留下最多的“經(jīng)驗(yàn)”。筆者在上海人工智能實(shí)驗(yàn)室和華東師大研究者合作的一篇論文里，就看到了一個(gè)有趣的例子。下面這兩張圖片非常類(lèi)似，但左圖在貨車(chē)上的交通錐應(yīng)該理解為貨物，而右圖在地上的交通錐又應(yīng)該理解為真正的道路標(biāo)識(shí)，而這兩種情況又對(duì)應(yīng)著不同的動(dòng)作。你可以整一堆包含類(lèi)似corner case的數(shù)據(jù)集，比如裝交通錐的是大皮卡小皮卡或者三輪車(chē)，讓自動(dòng)駕駛系統(tǒng)學(xué)會(huì)應(yīng)對(duì)這種情況，知道遇到作為“貨物”的交通錐不需要?jiǎng)x車(chē)。但棘手的是，算法又會(huì)在交通錐作為“道路標(biāo)識(shí)”的時(shí)候弄不明白狀態(tài)。

　　而在有了大模型過(guò)后，自動(dòng)駕駛系統(tǒng)也就被賦予了常識(shí)，汽車(chē)就像人的腦子一樣，可以基于常識(shí)通過(guò)推理解決上面提到的問(wèn)題。就像蘇坦在下午的論壇上所闡述的，基于BEV的感知大模型正在以吞食天地的速度快速消滅過(guò)去多個(gè)零散組合式的小模型，從而形成完整的一站式的大感知模型。同時(shí)，決策和規(guī)劃相關(guān)部分也開(kāi)始迅速引入大模型相關(guān)技術(shù)，開(kāi)始從過(guò)去的經(jīng)驗(yàn)系統(tǒng)、規(guī)則系統(tǒng)快速變成一套學(xué)習(xí)系統(tǒng)和一個(gè)向上可自我迭代的智能化系統(tǒng)。

　　目前，百度已經(jīng)基于BEV大模型打造了高階輔助駕駛，并且跑通了泊車(chē)、高速和城市的全域場(chǎng)景。據(jù)蘇坦介紹，在城市場(chǎng)景中，百度的純視覺(jué)方案已經(jīng)實(shí)現(xiàn)了與有激光雷達(dá)同樣好的產(chǎn)品體驗(yàn)。對(duì)智能汽車(chē)行業(yè)有關(guān)注的讀者大概知道，過(guò)去幾年這個(gè)賽道非常卷，廠家經(jīng)常以堆料的方式顯示自己的誠(chéng)意。但歸根結(jié)底消費(fèi)者關(guān)心的是使用體驗(yàn)，如果去掉不需要的激光雷達(dá)，那么產(chǎn)品的物料成本會(huì)更低很多，車(chē)企也會(huì)有更好的競(jìng)爭(zhēng)力。

　　在下午“大模型重構(gòu)智能汽車(chē)”論壇分享的末尾，官方還披露了一個(gè)振奮人心的消息。國(guó)內(nèi)首個(gè)純視覺(jué)城市領(lǐng)航高階智駕產(chǎn)品Apollo City Driving Max將在今年四季度量產(chǎn)落地，屆時(shí)大家將能看到整個(gè)自動(dòng)駕駛底層技術(shù)在基于大模型深度重構(gòu)后所帶來(lái)的澎湃的產(chǎn)品力、良好的用戶體驗(yàn)和科技給整個(gè)社會(huì)帶來(lái)的推動(dòng)力。

　　02、“重構(gòu)”帶來(lái)機(jī)遇

　　自去年底ChatGPT面世以來(lái)，國(guó)內(nèi)的科技公司爭(zhēng)先恐后加入到研發(fā)大模型的行列，把原本已經(jīng)部分沉寂的AI行業(yè)推向了一個(gè)新的高潮。而與此同時(shí)，出于降本增效或是其他理由，大廠也紛紛對(duì)某些業(yè)務(wù)線做了收縮和調(diào)整。于是在這一進(jìn)一退的對(duì)比中，也就有了外界解讀和揣測(cè)的余地。

　　比如，不少媒體就認(rèn)為大模型擠壓了自動(dòng)駕駛業(yè)務(wù)的生存空間，這是一個(gè)“新歡”取代“舊愛(ài)”的故事模板。

　　當(dāng)然，這類(lèi)新聞中引起最大關(guān)注的，是百度的動(dòng)作。原因也很簡(jiǎn)單，過(guò)去十年百度一直堅(jiān)持對(duì)自動(dòng)駕駛和其他人工智能領(lǐng)域的投入。無(wú)論是在公眾認(rèn)識(shí)里，還是說(shuō)實(shí)際的技術(shù)儲(chǔ)備，百度自動(dòng)駕駛都算是領(lǐng)頭羊。而這輪大模型浪潮中，百度又因?yàn)樽钤绨l(fā)布文心一言并持續(xù)迭代給外界留下了深刻印象。

　　的確，過(guò)去這段時(shí)間百度在大模型方面的進(jìn)展聲量頗大，但由此下結(jié)論說(shuō)百度放棄了自動(dòng)駕駛就多少談得上是癔癥了。

　　說(shuō)百度因?yàn)榇竽Ｐ头艞壸詣?dòng)駕駛的人估計(jì)沒(méi)搞明白一個(gè)技術(shù)問(wèn)題，就是大模型本身就是自動(dòng)駕駛的一個(gè)大buff。如我們?cè)谏厦嬉徽绿岬降�，有了大模型過(guò)后，像是自動(dòng)駕駛技術(shù)原來(lái)面臨的復(fù)雜規(guī)則、長(zhǎng)尾場(chǎng)景或是決策的可解釋性這些都將得到改善。既然自動(dòng)駕駛領(lǐng)域本身就落在大模型所要重構(gòu)的目標(biāo)域內(nèi)，那么對(duì)大模型浪潮的追逐不就包含了對(duì)自動(dòng)駕駛的追逐嗎?何談因此廢彼呢?

　　事實(shí)上，業(yè)界的觀點(diǎn)是自動(dòng)駕駛技術(shù)即將在兩三年內(nèi)迎來(lái)拐點(diǎn)。弗若斯特沙利文的研報(bào)顯示，雖然當(dāng)前傳統(tǒng)出租車(chē)/網(wǎng)約車(chē)單公里成本仍然顯著低于Robotaxi，但到2026的時(shí)候局面就會(huì)發(fā)生逆轉(zhuǎn)。

　　在智能汽車(chē)行業(yè)拐點(diǎn)臨近之際，百度Apollo在技術(shù)落地和量產(chǎn)交付的時(shí)候反而是提速的。截至當(dāng)前，Apollo汽車(chē)智能化解決方案已在31個(gè)汽車(chē)品牌、211款車(chē)型量產(chǎn)，累計(jì)搭載超900萬(wàn)輛。今年8月，搭載了Apollo Highway Driving Pro領(lǐng)航輔助智駕產(chǎn)品的新嵐圖FREE正式上市，也是Apollo行泊一體智駕產(chǎn)品的首款量產(chǎn)車(chē)型。接下來(lái)，在23年內(nèi)還將有近十款搭載百度Apollo高階智駕產(chǎn)品的車(chē)型量產(chǎn)。

　　對(duì)于一個(gè)累計(jì)投入了十年耗費(fèi)巨大的領(lǐng)域，在它即將兌現(xiàn)紅利的黎明之前，百度怎么可能放棄臨門(mén)一腳呢?

　　03、寫(xiě)在最后

　　在中國(guó)頭部的互聯(lián)網(wǎng)公司里，百度對(duì)技術(shù)的執(zhí)著尤其突出。在過(guò)去超過(guò)十年的時(shí)間里，李彥宏對(duì)包括自動(dòng)駕駛在內(nèi)的人工智能技術(shù)做了持續(xù)和巨大的投入。所以當(dāng)大模型浪潮到來(lái)的時(shí)候，百度已然做好了充分的準(zhǔn)備。

　　就目前的狀況而言，一個(gè)客觀的現(xiàn)實(shí)是，百度在自動(dòng)駕駛和大模型兩方面都處于領(lǐng)先位置。由于大模型將在自動(dòng)駕駛技術(shù)的發(fā)展中起到催化劑的作用，本就具有身位優(yōu)勢(shì)的百度自動(dòng)駕駛大概率會(huì)因大模型的加持做得更好。毫無(wú)疑問(wèn)，百度不會(huì)在大模型和自動(dòng)駕駛之間做二選一，而是全都要。

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

　　榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報(bào)生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

大模型得寵智能駕駛乘風(fēng)

最新新聞

熱門(mén)新聞

新動(dòng)態(tài)

關(guān)注度

最話題

大模型得寵 智能駕駛乘風(fēng)

相關(guān)閱讀

最新新聞

熱門(mén)新聞

新動(dòng)態(tài)

關(guān)注度

最話題

大模型得寵智能駕駛乘風(fēng)