金磊 夢晨 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號 QbitAI
“調(diào)教”一只機(jī)器狗學(xué)會(huì)新技能需要多長時(shí)間?
僅需5分鐘。
一個(gè)往左走的手勢,它就乖乖地向左挪了挪;一個(gè)“趴下”手勢,機(jī)器狗狗就立馬蹲了下去:
而且“狗狗”的視界也可以同步地展示出來。
這就是剛剛在Wave Summit+2021峰會(huì)現(xiàn)場中,百度飛槳秀出的AI新技能——自動(dòng)高效的模型部署能力。
而這,只是這場年度深度學(xué)習(xí)開發(fā)者盛宴中的一隅。
但站在當(dāng)下的時(shí)間節(jié)點(diǎn),從現(xiàn)場種種的“技巧展示”中,無不在透露著人工智能技術(shù)發(fā)展的一種新信號——創(chuàng)新在融合,門檻在降低。
一方面,AI技術(shù)及產(chǎn)業(yè)的融合創(chuàng)新越來越多;另一方面,雖然AI技術(shù)越來越復(fù)雜,但AI開發(fā)與應(yīng)用的門檻卻越來越低。
百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實(shí)驗(yàn)室主任王海峰在大會(huì)中所述:
深度學(xué)習(xí)推動(dòng)人工智能進(jìn)入工業(yè)大生產(chǎn)階段。面向技術(shù)和產(chǎn)業(yè)發(fā)展需求的AI大生產(chǎn)平臺(tái)可以讓AI技術(shù)以標(biāo)準(zhǔn)化、自動(dòng)化和模塊化的方式輸出給千行百業(yè),實(shí)現(xiàn)規(guī)模化應(yīng)用,同時(shí)以平臺(tái)為基礎(chǔ)促進(jìn)融合創(chuàng)新、共同發(fā)展。
那么基于這樣的“信號”,AI的發(fā)展在現(xiàn)階段又呈現(xiàn)著怎樣一種趨勢?
對此,百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實(shí)驗(yàn)室副主任吳甜表示:
全國各城市的AI開發(fā)者規(guī)模逐年增長,應(yīng)用人工智能的企業(yè)數(shù)量,也呈現(xiàn)了多地開花、多行業(yè)繁榮的景象。
但正所謂“臺(tái)上一分鐘,臺(tái)下十年功”。那么具體而言,在這些能力的背后,到底是什么樣的AI技術(shù)在加持,又是如何發(fā)揮著作用?
接下來,老規(guī)矩,我們一文看盡WAVE SUMMIT+2021。
飛槳再升級,煉大模型不忘開源看家本領(lǐng)
百度飛槳,中國首個(gè)自主研發(fā)、開源開放的產(chǎn)業(yè)級深度學(xué)習(xí)平臺(tái),便是“臺(tái)下十年功”的奧義之一。
這次飛槳公布了新版全景圖,值得一提的是,其中的產(chǎn)業(yè)級模型庫新增了百度剛剛新發(fā)布的產(chǎn)業(yè)級知識(shí)增強(qiáng)文心大模型,多年積累,讓大模型真正走進(jìn)了生產(chǎn)應(yīng)用。
在百度飛槳平臺(tái)上,開發(fā)者可以實(shí)現(xiàn)AI模型的便捷開發(fā)、高效訓(xùn)練和多端多平臺(tái)部署。
對此,王海峰認(rèn)為百度飛槳已經(jīng)成為典型的AI大生產(chǎn)平臺(tái),這一點(diǎn)從最新公布的成績單中也可以得到驗(yàn)證:
凝聚406萬開發(fā)者,創(chuàng)建47.6萬個(gè)模型,服務(wù)15.7萬家企事業(yè)單位,中國深度學(xué)習(xí)平臺(tái)綜合市場份額第一。
今天,飛槳開源框架也正式更新到2.2版本。
這次飛槳升級的方向正是進(jìn)一步加強(qiáng)融合創(chuàng)新,在開發(fā)、訓(xùn)練、部署全流程均有體現(xiàn)。
開發(fā)階段,飛槳API更加豐富、高效、兼容;
尤其是體系化新增了科學(xué)計(jì)算API,新增短時(shí)傅里葉變換API、Jacobian/Hessian API和高階自動(dòng)微分等功能。
可支持計(jì)算流體力學(xué)、分子動(dòng)力學(xué)等更廣泛的模型開發(fā),屬于跨學(xué)科、跨場景的融合創(chuàng)新。
像這樣的API,飛槳2.2版本新增了100多個(gè)。
訓(xùn)練階段 ,全新發(fā)布端到端自適應(yīng)大規(guī)模分布式訓(xùn)練技術(shù)。
4天前百度剛剛發(fā)布的全球首個(gè)知識(shí)增強(qiáng)千億大模型鵬城-百度·文心,就是基于這項(xiàng)技術(shù)訓(xùn)練出來。
端到端自適應(yīng),說的是把不同模型和硬件抽象成統(tǒng)一的分布式計(jì)算視圖和資源視圖,屬于軟件與硬件的融合創(chuàng)新。為了進(jìn)一步提高訓(xùn)練的穩(wěn)定性和資源利用率,飛槳還提供彈性調(diào)度模塊,能感知硬件資源變化,來自動(dòng)重構(gòu)資源視圖,觸發(fā)各個(gè)模塊自動(dòng)的發(fā)生變化。
部署階段,硬件適配是讓AI開發(fā)者最頭疼的問題,這次飛槳自研了3個(gè)硬件接入優(yōu)化方案:
Kernel Primitive API通過對算子計(jì)算與硬件的解耦,讓開發(fā)者能更加專注于實(shí)現(xiàn)計(jì)算邏輯本身,同時(shí)做到一處優(yōu)化可讓70多個(gè)算子同時(shí)受益。
NNAdapter統(tǒng)一適配層實(shí)現(xiàn)了實(shí)現(xiàn)了算子定義及框架調(diào)度執(zhí)行與硬件解耦,不僅降低框架和硬件適配的穩(wěn)定性,還降低了代碼的維護(hù)成本。
神經(jīng)網(wǎng)絡(luò)編譯器CINN (Compiler Infrastructure for Neural Networks),編利用基礎(chǔ)算子自動(dòng)融合優(yōu)化實(shí)現(xiàn)復(fù)雜算子功能,降低適配成本的同時(shí),優(yōu)化性能。
除了以上這些通用場景的技術(shù)升級,飛槳框架2.2還特別對文本任務(wù)做了從文本處理、訓(xùn)練、解碼到部署的全面加速。
如果說技術(shù)上的融合創(chuàng)新是在降低門檻上邁出的第一步,那么工具上的融合創(chuàng)新能讓飛槳技術(shù)更廣泛的落地。
飛槳企業(yè)版升級帶來了自動(dòng)高效的模型部署功能。
在推理性能方面,啟用了PaddleSlim根據(jù)不同模型和硬件的特點(diǎn)自動(dòng)選擇最佳壓縮路徑,在常見模型硬件上做到精度損失控制在1%以內(nèi),性能提升3-5倍。
在推理芯片的適配上,飛槳平臺(tái)已完成9345種模型芯片的組合的真實(shí)測試和調(diào)優(yōu),可以覆蓋95%的需求場景,節(jié)省97%的適配和開發(fā)時(shí)間。
在智能邊緣控制臺(tái)上,你可以直接看到以上模型服務(wù)的部署和管理,對輸入設(shè)備、服務(wù)、事件進(jìn)行實(shí)時(shí)監(jiān)控管理。
另外還有一個(gè)“彩蛋”——零門檻AI開發(fā)平臺(tái)飛槳EasyDL現(xiàn)在有了桌面版,一鍵極速安裝,本地高效建模。
這次一起獲得升級的還有飛槳產(chǎn)業(yè)級開源模型庫。
百度結(jié)合場景的需求痛點(diǎn),推出13個(gè)結(jié)合場景應(yīng)用深度優(yōu)化過的PP系列模型,實(shí)現(xiàn)精度和性能的平衡。
到目前為止,飛槳產(chǎn)業(yè)級開源模型庫已支持超過400個(gè)模型,涵蓋CV、NLP、推薦系統(tǒng)、語音等多種方向。
那么這些產(chǎn)業(yè)級的開源模型都用在了哪里呢?
已經(jīng)用在了你身邊
這樣的技術(shù),其實(shí)離我們的生活并不遙遠(yuǎn)。
例如上海哲元科技發(fā)展有限公司在制造業(yè)上有著多年的經(jīng)驗(yàn),在數(shù)字化大浪潮之下,選擇采用百度飛槳的EasyDL來提高效率。
具體而言,他們基于飛槳EasyDL訓(xùn)練出食品生產(chǎn)流水線數(shù)量清點(diǎn)及外觀檢測模型。
這樣就能夠做到從蛋卷皮外觀、巧克力噴涂、灌料、撒料、壓蓋、包裝全流程智能化檢測。
值得一提的是,今年9月,在上海哲元提供的智能化質(zhì)檢系統(tǒng)加持下,該冰淇淋品牌位于江蘇太倉的工廠被認(rèn)證為世界級“燈塔工廠”,更是全球冰淇淋行業(yè)的第一家“燈塔工廠”。
而之所以他們選擇EasyDL,易上手和精度高是主要的原因。
公司2名研發(fā)從接觸EasyDL到訓(xùn)練完成所需要的模型并實(shí)際應(yīng)用僅花費(fèi)二十多個(gè)工時(shí),同時(shí)模型還可根據(jù)客戶需求靈活迭代優(yōu)化,快捷方便。
再如華夏天信機(jī)器人公司,專注于工礦企業(yè)智能硬件設(shè)備的研發(fā)、生產(chǎn)和實(shí)施。
而在中國近萬座礦山的生產(chǎn)環(huán)節(jié)中,輸煤用帶式輸送機(jī)是一種重要的煤炭運(yùn)輸設(shè)備,礦區(qū)用量可達(dá)十幾臺(tái)至上百臺(tái)不等,是整體產(chǎn)業(yè)鏈中重要的一環(huán)。
但以往對此的監(jiān)控方式都采用的是人工,包括巡檢和安裝固定攝像頭等等。
這就非常的耗時(shí)耗力,以巡檢為例,一天頻率為2到3次,有時(shí)2人每組,重要的皮帶設(shè)備還需6人實(shí)施3班倒。
而現(xiàn)在,華夏天信基于飛槳的目標(biāo)檢測工具套件PaddleDetection,開發(fā)出的輸煤膠帶智能巡檢機(jī)器人。
如此一來,不僅能實(shí)現(xiàn)高頻次、無間歇巡檢,還能通過攝像儀將實(shí)時(shí)視頻回傳并智能識(shí)別分析。
可以說是一次性解決了工作效率、惡劣環(huán)境、作業(yè)安全等多項(xiàng)難題。
為了更好助推AI產(chǎn)業(yè)應(yīng)用落地,飛槳此次還推出業(yè)界首個(gè)產(chǎn)業(yè)實(shí)踐范例庫,從真實(shí)產(chǎn)業(yè)場景分析、完整代碼實(shí)現(xiàn),到詳細(xì)過程解析,直達(dá)項(xiàng)目落地,覆蓋數(shù)十個(gè)高頻應(yīng)用場景,推動(dòng)AI落地可復(fù)制和規(guī)模化。
而對于百度飛槳來說,技術(shù)本身和產(chǎn)業(yè)應(yīng)用固然重要,但還有一點(diǎn)也是百度要“狠抓”的。
這就是開發(fā)者和生態(tài)。
越發(fā)熱鬧的飛槳社區(qū)
在生態(tài)方面,百度飛槳這一次升級了“大航海”計(jì)劃,正式邁入2.0時(shí)代。
具體而言,就是在原有的啟航、護(hù)航、領(lǐng)航三大航道基礎(chǔ)上,新增“共創(chuàng)”計(jì)劃。
啟航計(jì)劃是飛槳將投入總價(jià)值5億元的資金與資源,支持全國500所高校,重點(diǎn)培訓(xùn)5000位高校AI師資,聯(lián)合培養(yǎng)50萬AI學(xué)子。
護(hù)航計(jì)劃面向產(chǎn)業(yè)智能化。要達(dá)到的是智能升級,通過技術(shù)賦能、市場推廣和資源導(dǎo)入,縮短技術(shù)創(chuàng)新到商業(yè)落地的路徑。
而領(lǐng)航計(jì)劃的面向群體,則是核心開發(fā)者,目標(biāo)是與社區(qū)開發(fā)者一起共建開源生態(tài),并探索前沿技術(shù)。
而此次新增的“共創(chuàng)”板塊,可以分三個(gè)方向來看:
聯(lián)合社區(qū)開發(fā)者:共創(chuàng)工具、模型、產(chǎn)業(yè)實(shí)踐經(jīng)驗(yàn)
形成產(chǎn)業(yè)創(chuàng)新需求對接平臺(tái):共創(chuàng)產(chǎn)學(xué)研用融合正循環(huán)
建設(shè)人工智能產(chǎn)業(yè)賦能中心:共創(chuàng)區(qū)域創(chuàng)新生態(tài)
至于其背后的緣由,吳甜解釋道:
建設(shè)飛槳需要抓住的關(guān)鍵點(diǎn)有三個(gè),技術(shù)持續(xù)創(chuàng)新、功能體驗(yàn)以開發(fā)者的需求為首位,以及廣泛地與生態(tài)共享、共創(chuàng)。
那么在“大航海”計(jì)劃的加持之下,百度飛槳的開發(fā)者都得到哪些益處?
在活動(dòng)現(xiàn)場中,來自哈爾濱工業(yè)大學(xué)大三的學(xué)生曹志浩便分享了他的故事。
他從大一開始就接觸飛槳AI Studio學(xué)習(xí)與實(shí)訓(xùn)社區(qū),一路上已經(jīng)是三載時(shí)光。
而在最初身為小白的他,最頭疼的便是不知如何入手,很難找到實(shí)踐的方法。
也花費(fèi)過時(shí)間、精力在市面上的產(chǎn)品中“貨比三家”,還自掏腰包買算力。
但當(dāng)曹志浩接觸飛槳開發(fā)者社區(qū)之后,這些問題便全部迎刃而解、煙消云散了:
飛槳平臺(tái)上面有著非常豐富的一些學(xué)習(xí)資源和開發(fā)環(huán)境,幫助我的一些數(shù)理基礎(chǔ)打得更扎實(shí)或者一些進(jìn)階的都可以在里面找到。
還有一些產(chǎn)品級的應(yīng)用、前沿的模型,包括算力開發(fā)的流程都會(huì)在上面有所展現(xiàn)。
我可以在飛槳AI Studio社區(qū)上面開源一些代碼,包括在上面也開源了一些3D點(diǎn)云的算法和基礎(chǔ)原理的實(shí)現(xiàn),還有一些趣味性的項(xiàng)目和實(shí)用性的項(xiàng)目,比如APP的開發(fā)。
不僅如此,曹志浩還認(rèn)為在這條路上進(jìn)階過程“不是一個(gè)人”,他在開發(fā)者社區(qū)里遇到了許多志同道合的小伙伴。
他們分享讀論文的經(jīng)驗(yàn)、交流困惑,還組建團(tuán)隊(duì)共同“打怪升級”,并肩作戰(zhàn)開源的3D點(diǎn)云模型倉庫,支持一系列算法。
曹志浩分享的故事,只是眾多飛槳開發(fā)者中的一例。
而類似的故事在持續(xù)不斷地譜寫著:
鐵路工人在工作之余自學(xué)AI,基于飛槳實(shí)現(xiàn)了鐵路貨運(yùn)車號的自動(dòng)識(shí)別,為所在鐵路段節(jié)省數(shù)十萬元成本。
吉林大學(xué)的師生團(tuán)隊(duì)聯(lián)合飛槳,打造了已在生產(chǎn)線上應(yīng)用的藥瓶自動(dòng)化檢測系統(tǒng),并沉淀為教學(xué)課程,幫助更多師生學(xué)習(xí)AI技術(shù)和應(yīng)用。
……
那么最后一個(gè)問題便是,百度飛槳為什么如此重視開發(fā)者和生態(tài)呢?
人才人才,還是人才
無論是技術(shù)發(fā)展、產(chǎn)業(yè)升級還是社區(qū)建設(shè),歸根結(jié)底都要靠人來實(shí)現(xiàn)。
隨著AI與產(chǎn)業(yè)的深度融合,需要越來越多既懂AI,又具備產(chǎn)業(yè)經(jīng)驗(yàn)的復(fù)合型AI人才。
百度飛槳在AI人才的培養(yǎng)上積累已久。面向高校,飛槳積極踐行的是“產(chǎn)教融合”的路徑:合作人工智能相關(guān)教材、提供人工智能教育資源,超過700所高校的3000多名AI專業(yè)教師從飛槳舉辦的深度學(xué)習(xí)師資培訓(xùn)中受益,百余所高校的學(xué)生基于飛槳開發(fā)創(chuàng)意項(xiàng)目、參與各類AI技術(shù)競賽。
更深一步,則是探索產(chǎn)教融合協(xié)同育人路徑。
如吉林大學(xué)三創(chuàng)實(shí)驗(yàn)室(創(chuàng)意、創(chuàng)新、創(chuàng)業(yè))團(tuán)隊(duì)針對醫(yī)藥企業(yè)藥瓶缺陷檢測場景需求,基于飛槳平臺(tái)創(chuàng)新研發(fā)了一套全方位、高精度的自動(dòng)化檢測系統(tǒng),并實(shí)現(xiàn)了產(chǎn)線落地。
吉林大學(xué)還與飛槳共建了CV及AI+質(zhì)檢課程體系,將課程資源全面開放,通過飛槳學(xué)習(xí)與實(shí)訓(xùn)社區(qū)AI Studio,將這一實(shí)踐經(jīng)驗(yàn)輸送給百萬開發(fā)者。
面向產(chǎn)業(yè),在復(fù)合型人才的培養(yǎng)上,深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實(shí)驗(yàn)室與百度聯(lián)合發(fā)起創(chuàng)辦了首席AI架構(gòu)師培養(yǎng)計(jì)劃 (AICA)。
首席AI架構(gòu)師培養(yǎng)計(jì)劃目前已舉辦到第5期,累計(jì)向業(yè)界輸送190名AI架構(gòu)師,遍布工業(yè)、農(nóng)業(yè)、金融、交通、能源等數(shù)十個(gè)行業(yè)。
吳甜從中觀察到,每期學(xué)員們提出的課題,越來越深入到行業(yè)的關(guān)鍵問題,專業(yè)度逐年提升。
縱觀整場Wave Summit+峰會(huì),百度飛槳在產(chǎn)業(yè)、開源、人才培養(yǎng)方面下了這么大功夫,為什么?
答案依舊是王海峰在開場提到的融合創(chuàng)新與降低門檻的大趨勢。
除了多種技術(shù)之間、技術(shù)與場景的融合,產(chǎn)業(yè)界、學(xué)術(shù)界、AI企業(yè)和開源平臺(tái)之間也在進(jìn)行更廣泛的融合。
隨著AI落地在更多如金融、醫(yī)療、制造、能源,乃至文娛體育這樣的傳統(tǒng)行業(yè),不斷降低技術(shù)門檻,打通產(chǎn)學(xué)研用形成正向循環(huán),就成了人工智能發(fā)展的關(guān)鍵。
其根本目的還是更好地讓技術(shù)本身和產(chǎn)業(yè)發(fā)展相結(jié)合,不斷為經(jīng)濟(jì)發(fā)展注入新的活力,促進(jìn)產(chǎn)業(yè)升級和智能化轉(zhuǎn)型。
于是我們看到了由飛槳框架2.2新版本、飛槳產(chǎn)業(yè)級開源模型庫、大航海2.0共創(chuàng)計(jì)劃等項(xiàng)目共同組成的這份給開發(fā)者的“雙12大禮包”。
在峰會(huì)現(xiàn)場,飛槳生態(tài)里的開發(fā)者們也把這一天過成了開發(fā)者的節(jié)日,許多人帶著自己在飛槳平臺(tái)上開發(fā)的作品來“練攤”。
像開頭的機(jī)器狗在現(xiàn)場學(xué)習(xí)的新模型,就是一位個(gè)人開發(fā)者帶來展示交流,被選中后登上主舞臺(tái)的。
百度飛槳準(zhǔn)備的這一份雙12大禮包,你還滿意么?
本文首發(fā)于微信公眾號:量子位
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...