2023年10月17日,百度世界大會(huì)2023在北京首鋼園舉行。創(chuàng)始人李彥宏以“歡迎來(lái)到生成式人工智能的時(shí)代”開(kāi)場(chǎng),發(fā)表了主題為《手把手教你做AI原生應(yīng)用》的演講。作為大模型浪潮正式到來(lái)后的首次世界大會(huì),這屆的主題被百度定為“生成未來(lái)”。發(fā)布會(huì)上首先亮相的產(chǎn)品,便是重磅的文心大模型4.0版本。相較于7個(gè)月前初次發(fā)布文心一言時(shí)坦誠(chéng)的提到“不夠完美”“承認(rèn)差距”,臺(tái)上的Robin這次顯然更加從容自信:
“這是我們認(rèn)為迄今為止最強(qiáng)大的文心大模型,它的基礎(chǔ)模型實(shí)現(xiàn)了全面升級(jí),在理解、生成、邏輯、記憶這四大能力上,相比于大家現(xiàn)在用的線上的文心一言版本是有明顯提升的,綜合水平跟GPT4相比也已經(jīng)毫不遜色。”
從現(xiàn)場(chǎng)的演示看,文心大模型4.0版本的確涌現(xiàn)出了相當(dāng)高的智能水平。李彥宏扮演了一個(gè)“刁蠻”的測(cè)試用戶,向其詢問(wèn)到“我想回承德買房,能用公積金貸款嗎,手續(xù)怎么辦?我在北京工作。”而文心大模型4.0的回答表明,即便面對(duì)這類涉及亂序表述、模糊意圖乃至潛臺(tái)詞的問(wèn)題,它應(yīng)對(duì)起來(lái)依舊游刃有余。
基于全新的文心大模型核心能力,百度在過(guò)去幾個(gè)月里,對(duì)集團(tuán)內(nèi)部的幾乎所有產(chǎn)品做了重構(gòu),即李彥宏說(shuō)的“手把手教你做AI原生應(yīng)用”。最核心的百度搜索在大模型加持下,已經(jīng)具備極致滿足、推薦激發(fā)、多輪交互三個(gè)特點(diǎn)。百度產(chǎn)品矩陣中的擔(dān)當(dāng)角色,如地圖、網(wǎng)盤、文庫(kù)等在重構(gòu)后革新了用戶體驗(yàn)。而像國(guó)內(nèi)首個(gè)生成式商業(yè)智能產(chǎn)品“百度GBI”和“如流”這類新一代智能工作平臺(tái),則顯示出“AI原生”這個(gè)新要素在生產(chǎn)力方面所能創(chuàng)造的巨大價(jià)值。
當(dāng)然,百度自動(dòng)駕駛基于大模型的新進(jìn)展,也在這次會(huì)議上向外界做了展示。目前,百度蘿卜快跑訂單總量已超過(guò)400萬(wàn)單,是全球最大的自動(dòng)駕駛出行服務(wù)商。百度集團(tuán)資深副總裁、智能駕駛事業(yè)群組總裁李震宇以視頻方式做了演示,他在機(jī)場(chǎng)打了一輛蘿卜快跑的“真無(wú)人車”,車輛在繁華復(fù)雜的城市道路上穿梭自如,并最終順利達(dá)到目的地,引發(fā)現(xiàn)場(chǎng)一陣驚嘆。
相較于上面提到的這些互聯(lián)網(wǎng)應(yīng)用,自動(dòng)駕駛跟大模型的結(jié)合有著特別的意義,因?yàn)樗笳髦竽P蛯?duì)世界的重構(gòu)從信息空間拓展到了物理空間。如李彥宏所說(shuō),大模型將會(huì)讓百度的自動(dòng)駕駛能力超越經(jīng)驗(yàn)系統(tǒng),更聰明處理復(fù)雜場(chǎng)景,實(shí)現(xiàn)更廣泛的時(shí)空覆蓋。
01、自動(dòng)駕駛長(zhǎng)腦子
李想國(guó)慶假期前的最后一周,拉著王興和陸奇等人開(kāi)了場(chǎng)秋季戰(zhàn)略會(huì)。這場(chǎng)戰(zhàn)略會(huì)上,智能駕駛被提到了空前高度,這群人單獨(dú)花了一整天來(lái)討論智駕要如何投入。李想本人在會(huì)上做了某種意義上的自我批評(píng),他認(rèn)為智駕應(yīng)該提前半年投入,也就是從去年中,而不是今年初才開(kāi)始上強(qiáng)度。
這個(gè)判斷有著充足的現(xiàn)實(shí)素材做支撐。L2級(jí)自動(dòng)駕駛在去年底已經(jīng)成為標(biāo)配,而具備高速點(diǎn)對(duì)點(diǎn)和NOA的高階智能駕駛能力將在2025年達(dá)到15%以上的搭載率。從乘聯(lián)會(huì)發(fā)布的乘用車價(jià)格段市場(chǎng)結(jié)構(gòu)看,這個(gè)比例幾乎涵蓋了價(jià)格在25萬(wàn)以上的所有車型。相對(duì)應(yīng)的,2025年智能駕駛在所有購(gòu)車因素中的決策占比也將從過(guò)去的不到2%快速增長(zhǎng)到超過(guò)30%。所以對(duì)于車企而言,尤其是瞄準(zhǔn)中高端市場(chǎng)的廠商,智能駕駛是個(gè)做了不一定能活到最后,但不做一定立馬就死的必選項(xiàng)。
這個(gè)過(guò)程中,基于大模型的生成式AI技術(shù)將扮演關(guān)鍵的催化劑角色。具體來(lái)講,可以大致分成兩個(gè)層面。
一是由于大模型具有理解、生成、推理、記憶的能力,它將完全重塑智能座艙的體驗(yàn),“使得智能座艙內(nèi)人的體驗(yàn)徹底變?yōu)槿撕吞摂M人之間的一個(gè)全新關(guān)系”。未來(lái)人跟汽車的交互將從現(xiàn)在基于圖形界面的GUI模式,轉(zhuǎn)向更符合人類通過(guò)語(yǔ)言交流的LUI模式。在兩年前的世界大會(huì)上,百度首次提出了“汽車機(jī)器人”的前瞻概念,而隨著大模型在智能座艙上面的普遍應(yīng)用,這個(gè)概念正在一步步變得具象和現(xiàn)實(shí)。
因此,在文心大模型的基礎(chǔ)上,結(jié)合百度對(duì)于智能汽車的理解以及過(guò)去多年在領(lǐng)域內(nèi)累積的人機(jī)交互數(shù)據(jù),IDG進(jìn)一步迭代出了智艙大模型。在具備文心大模型智力的同時(shí),跟出行場(chǎng)景和車內(nèi)環(huán)境做了深度融合。OEM廠商通過(guò)官方提供的智艙開(kāi)發(fā)工具鏈,可以非常方便地打造帶有車企自身特色的下一代導(dǎo)航、交互、信息服務(wù)、用車場(chǎng)景等一系列的智艙原生應(yīng)用。百度智能駕駛事業(yè)群組智能汽車業(yè)務(wù)部總經(jīng)理蘇坦在論壇上的描述,就是“通用大模型、行業(yè)大模型和品牌大模型,是讓用戶體驗(yàn)變得越來(lái)越好的三級(jí)火箭。”
在智能座艙之外,大模型還將對(duì)自動(dòng)駕駛技術(shù)本身帶來(lái)躍進(jìn),百度稱之為智駕或者視覺(jué)大模型。最近一段時(shí)間,國(guó)內(nèi)自動(dòng)駕駛行業(yè)最重要的一波技術(shù)潮流,就是車企紛紛轉(zhuǎn)型基于BEV+Transformer的純視覺(jué)路線。
在此之前,智能駕駛系統(tǒng)實(shí)際是以傳統(tǒng)的組件堆砌方式實(shí)現(xiàn)的。例如在感知領(lǐng)域,不同的小模型負(fù)責(zé)不同的功能,然后這些小模型組合在一起形成一個(gè)系統(tǒng)。例如,車道線的檢測(cè)、紅綠燈的檢測(cè)和障礙物的檢測(cè)都由各自的小模型實(shí)現(xiàn)。但這種方式顯然會(huì)給數(shù)據(jù)搜集和系統(tǒng)智能化的組合帶來(lái)問(wèn)題。
規(guī)劃控制方面也類似,過(guò)去是基于規(guī)則和經(jīng)驗(yàn)的系統(tǒng),就是說(shuō)提供一些預(yù)定義的規(guī)則或者訓(xùn)練系統(tǒng)時(shí)喂給它不同的場(chǎng)景,讓系統(tǒng)知道后續(xù)再次遇到類似場(chǎng)景應(yīng)該如何做。這樣做帶來(lái)了兩個(gè)問(wèn)題,首先是有些場(chǎng)景下你很難把規(guī)則說(shuō)清楚。比如10月4號(hào),清華、港大和UCB的研究人員就在arXiv上剛剛發(fā)表了一篇論文。他們舉了個(gè)例子,如果前面的路口沒(méi)有交通信號(hào)燈,而正駕駛車輛打算左轉(zhuǎn)的你,迎面來(lái)了一輛直行車輛。這種情況下,熟悉交通規(guī)則的人類駕駛員直覺(jué)上就知道要減速讓行,但現(xiàn)有的高級(jí)自動(dòng)駕駛系統(tǒng)卻往往需要設(shè)計(jì)極其復(fù)雜的規(guī)則或者獎(jiǎng)懲函數(shù)才能有效處理類似場(chǎng)景。
其次是很難處理corner case,因?yàn)楦哳l剛需的場(chǎng)景會(huì)給系統(tǒng)留下最多的“經(jīng)驗(yàn)”。筆者在上海人工智能實(shí)驗(yàn)室和華東師大研究者合作的一篇論文里,就看到了一個(gè)有趣的例子。下面這兩張圖片非常類似,但左圖在貨車上的交通錐應(yīng)該理解為貨物,而右圖在地上的交通錐又應(yīng)該理解為真正的道路標(biāo)識(shí),而這兩種情況又對(duì)應(yīng)著不同的動(dòng)作。你可以整一堆包含類似corner case的數(shù)據(jù)集,比如裝交通錐的是大皮卡小皮卡或者三輪車,讓自動(dòng)駕駛系統(tǒng)學(xué)會(huì)應(yīng)對(duì)這種情況,知道遇到作為“貨物”的交通錐不需要?jiǎng)x車。但棘手的是,算法又會(huì)在交通錐作為“道路標(biāo)識(shí)”的時(shí)候弄不明白狀態(tài)。
而在有了大模型過(guò)后,自動(dòng)駕駛系統(tǒng)也就被賦予了常識(shí),汽車就像人的腦子一樣,可以基于常識(shí)通過(guò)推理解決上面提到的問(wèn)題。就像蘇坦在下午的論壇上所闡述的,基于BEV的感知大模型正在以吞食天地的速度快速消滅過(guò)去多個(gè)零散組合式的小模型,從而形成完整的一站式的大感知模型。同時(shí),決策和規(guī)劃相關(guān)部分也開(kāi)始迅速引入大模型相關(guān)技術(shù),開(kāi)始從過(guò)去的經(jīng)驗(yàn)系統(tǒng)、規(guī)則系統(tǒng)快速變成一套學(xué)習(xí)系統(tǒng)和一個(gè)向上可自我迭代的智能化系統(tǒng)。
目前,百度已經(jīng)基于BEV大模型打造了高階輔助駕駛,并且跑通了泊車、高速和城市的全域場(chǎng)景。據(jù)蘇坦介紹,在城市場(chǎng)景中,百度的純視覺(jué)方案已經(jīng)實(shí)現(xiàn)了與有激光雷達(dá)同樣好的產(chǎn)品體驗(yàn)。對(duì)智能汽車行業(yè)有關(guān)注的讀者大概知道,過(guò)去幾年這個(gè)賽道非常卷,廠家經(jīng)常以堆料的方式顯示自己的誠(chéng)意。 但歸根結(jié)底消費(fèi)者關(guān)心的是使用體驗(yàn),如果去掉不需要的激光雷達(dá),那么產(chǎn)品的物料成本會(huì)更低很多,車企也會(huì)有更好的競(jìng)爭(zhēng)力。
在下午“大模型重構(gòu)智能汽車”論壇分享的末尾,官方還披露了一個(gè)振奮人心的消息。國(guó)內(nèi)首個(gè)純視覺(jué)城市領(lǐng)航高階智駕產(chǎn)品Apollo City Driving Max將在今年四季度量產(chǎn)落地,屆時(shí)大家將能看到整個(gè)自動(dòng)駕駛底層技術(shù)在基于大模型深度重構(gòu)后所帶來(lái)的澎湃的產(chǎn)品力、良好的用戶體驗(yàn)和科技給整個(gè)社會(huì)帶來(lái)的推動(dòng)力。
02、“重構(gòu)”帶來(lái)機(jī)遇
自去年底ChatGPT面世以來(lái),國(guó)內(nèi)的科技公司爭(zhēng)先恐后加入到研發(fā)大模型的行列,把原本已經(jīng)部分沉寂的AI行業(yè)推向了一個(gè)新的高潮。而與此同時(shí),出于降本增效或是其他理由,大廠也紛紛對(duì)某些業(yè)務(wù)線做了收縮和調(diào)整。于是在這一進(jìn)一退的對(duì)比中,也就有了外界解讀和揣測(cè)的余地。
比如,不少媒體就認(rèn)為大模型擠壓了自動(dòng)駕駛業(yè)務(wù)的生存空間,這是一個(gè)“新歡”取代“舊愛(ài)”的故事模板。
當(dāng)然,這類新聞中引起最大關(guān)注的,是百度的動(dòng)作。原因也很簡(jiǎn)單,過(guò)去十年百度一直堅(jiān)持對(duì)自動(dòng)駕駛和其他人工智能領(lǐng)域的投入。無(wú)論是在公眾認(rèn)識(shí)里,還是說(shuō)實(shí)際的技術(shù)儲(chǔ)備,百度自動(dòng)駕駛都算是領(lǐng)頭羊。而這輪大模型浪潮中,百度又因?yàn)樽钤绨l(fā)布文心一言并持續(xù)迭代給外界留下了深刻印象。
的確,過(guò)去這段時(shí)間百度在大模型方面的進(jìn)展聲量頗大,但由此下結(jié)論說(shuō)百度放棄了自動(dòng)駕駛就多少談得上是癔癥了。
說(shuō)百度因?yàn)榇竽P头艞壸詣?dòng)駕駛的人估計(jì)沒(méi)搞明白一個(gè)技術(shù)問(wèn)題,就是大模型本身就是自動(dòng)駕駛的一個(gè)大buff。如我們?cè)谏厦嬉徽绿岬降�,有了大模型過(guò)后,像是自動(dòng)駕駛技術(shù)原來(lái)面臨的復(fù)雜規(guī)則、長(zhǎng)尾場(chǎng)景或是決策的可解釋性這些都將得到改善。既然自動(dòng)駕駛領(lǐng)域本身就落在大模型所要重構(gòu)的目標(biāo)域內(nèi),那么對(duì)大模型浪潮的追逐不就包含了對(duì)自動(dòng)駕駛的追逐嗎?何談因此廢彼呢?
事實(shí)上,業(yè)界的觀點(diǎn)是自動(dòng)駕駛技術(shù)即將在兩三年內(nèi)迎來(lái)拐點(diǎn)。弗若斯特沙利文的研報(bào)顯示,雖然當(dāng)前傳統(tǒng)出租車/網(wǎng)約車單公里成本仍然顯著低于Robotaxi,但到2026的時(shí)候局面就會(huì)發(fā)生逆轉(zhuǎn)。
在智能汽車行業(yè)拐點(diǎn)臨近之際,百度Apollo在技術(shù)落地和量產(chǎn)交付的時(shí)候反而是提速的。截至當(dāng)前,Apollo汽車智能化解決方案已在31個(gè)汽車品牌、211款車型量產(chǎn),累計(jì)搭載超900萬(wàn)輛。今年8月,搭載了Apollo Highway Driving Pro領(lǐng)航輔助智駕產(chǎn)品的新嵐圖FREE正式上市,也是Apollo行泊一體智駕產(chǎn)品的首款量產(chǎn)車型。接下來(lái),在23年內(nèi)還將有近十款搭載百度Apollo高階智駕產(chǎn)品的車型量產(chǎn)。
對(duì)于一個(gè)累計(jì)投入了十年耗費(fèi)巨大的領(lǐng)域,在它即將兌現(xiàn)紅利的黎明之前,百度怎么可能放棄臨門一腳呢?
03、寫在最后
在中國(guó)頭部的互聯(lián)網(wǎng)公司里,百度對(duì)技術(shù)的執(zhí)著尤其突出。在過(guò)去超過(guò)十年的時(shí)間里,李彥宏對(duì)包括自動(dòng)駕駛在內(nèi)的人工智能技術(shù)做了持續(xù)和巨大的投入。所以當(dāng)大模型浪潮到來(lái)的時(shí)候,百度已然做好了充分的準(zhǔn)備。
就目前的狀況而言,一個(gè)客觀的現(xiàn)實(shí)是,百度在自動(dòng)駕駛和大模型兩方面都處于領(lǐng)先位置。由于大模型將在自動(dòng)駕駛技術(shù)的發(fā)展中起到催化劑的作用,本就具有身位優(yōu)勢(shì)的百度自動(dòng)駕駛大概率會(huì)因大模型的加持做得更好。毫無(wú)疑問(wèn),百度不會(huì)在大模型和自動(dòng)駕駛之間做二選一,而是全都要。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...