[No.X001-2]
7月27日,由中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)指導(dǎo),微博、新浪新聞主辦的人工智能領(lǐng)域行業(yè)峰會(huì)“融合生態(tài) 價(jià)值共創(chuàng)”2022新智者大會(huì)召開。NVIDIA英偉達(dá)中國(guó)區(qū)Omniverse負(fù)責(zé)人何展在大會(huì)的“元宇宙,智能時(shí)代的下一站”議題中,向來自業(yè)界、學(xué)界的嘉賓們介紹了NVIDIA Omniverse在創(chuàng)建數(shù)字世界方面的一些探索和成果。
2022新智者大會(huì)-英偉達(dá)中國(guó)區(qū)Omniverse負(fù)責(zé)人何展做主題演講
以下為何展演講實(shí)錄,內(nèi)容經(jīng)編輯略有刪減:
何展:大家好,歡迎參加2022心智者大會(huì),接下來的時(shí)間由我來和大家分享,NVIDIA Omniverse和您一起創(chuàng)建數(shù)字世界的演講,我來自NVIDIA英偉達(dá),我叫何展。
首先和大家去分享一下,我們今天的第一頁,來跟大家去展示一下英偉達(dá)公司是一家什么樣的公司,這里給大家展示的是我們硅谷總部的大樓,非常漂亮,非常充滿科技感的兩棟建筑。
這兩棟建筑在設(shè)計(jì)的時(shí)間里面,我們做的渲染的效果圖,都是來自今天我們重點(diǎn)和大家分享的NVIDIA Omniverse這樣的一個(gè)技術(shù)平臺(tái),我們也非常歡迎大家有機(jī)會(huì)到硅谷一起去參觀我們這棟非常有科技感的大樓。
那今天也給大家去分享一下,我們NVIDIA英偉達(dá)公司實(shí)際上是解決世界上很多難以解決的科研問題,甚至是一系列的計(jì)算,一系列應(yīng)用難題的一家公司,非常的技術(shù)。我們今天,首先給大家?guī)韮蓚(gè)案例和大家做一個(gè)開頭的分享。
第一個(gè)案例,是我和我們的科研人員一起去分析我們?nèi)祟愖畲蟮奶鞌�,其�?shí)就是癌癥,大家可以看到這張圖非常清晰的這些數(shù)字化,模擬的很多的一些高危險(xiǎn)系數(shù)的圖像,大家可以看到,這是我們科研人員通過我們的實(shí)驗(yàn)室的這種高精度的顯微鏡去觀測(cè)到的一個(gè)非常罕見的現(xiàn)象。
這個(gè)現(xiàn)象是什么,大家可以看到,我們的癌細(xì)胞實(shí)際上是分裂是一個(gè),由一個(gè)分裂成兩個(gè),那我們?cè)偻ㄟ^這樣的技術(shù),可以觀測(cè)到一個(gè)罕見現(xiàn)象是一個(gè)變成了三個(gè),那這類的,我們需要數(shù)字化的這些技術(shù)來去觀測(cè)到,去模擬和仿真的到,那這樣的話,就會(huì)可以幫助我們科研人員更好地輔助我們的一些算法,來去幫助到大家去處理,或者是去提前找到方法,去解決這樣的一些罕見的這種疑難雜癥,這是第一個(gè),這也是給大家分享,我們通過數(shù)字化給我們?nèi)祟悗砗蜕眢w健康有關(guān)的這樣的一個(gè)項(xiàng)目。
那么再看第二個(gè)項(xiàng)目,大家可能沒有特別關(guān)注的天體力學(xué),包括我們大家看到很多科幻的小說,可能會(huì)很多人關(guān)注和喜歡這類方向的技術(shù)。
那這里給大家分享,這是我們?cè)?016年的一個(gè)項(xiàng)目,這是人類我們的科學(xué)家有史以來,第一次發(fā)現(xiàn)了引力波,大家都知道黑洞形成的概念,也有很多科技迷,愛好者,科幻迷愛好者喜歡這類的東西,我們是第一次在實(shí)驗(yàn)中,我們發(fā)現(xiàn)了引力波的存在,這里也應(yīng)用到了我們很多的技術(shù),所以這里邊有三位物理學(xué)家在2017年,因此獲得了諾貝爾物理學(xué)獎(jiǎng),這里邊也是有我們的NVIDIA GPU,包括在這里邊做到的一系列的貢獻(xiàn)。那分享完了這些案例,大家可能看到我們現(xiàn)在不僅僅是一家硬件的公司,不僅僅是一家GPU公司,我們解決得非常非常多的(問題),通過好的技術(shù),來去解決很多新的業(yè)務(wù)應(yīng)用,新的科學(xué)難題的,這樣一家全軟件堆棧的AI計(jì)算平臺(tái)公司。
我介紹完我們公司的定位,還有做的一些事情之后,跟大家進(jìn)入今天的主要的內(nèi)容。
首先和大家分享一下,我們這個(gè)時(shí)代是一個(gè)全新的數(shù)字化時(shí)代,我們即將進(jìn)入一個(gè)帶有現(xiàn)在非常多因素和科技含量?jī)?nèi)容的這樣的一個(gè)時(shí)代,大家看到這里邊有我們可以關(guān)注到3D,沉浸式的體驗(yàn),我們還有新社交,我們還有很多很多的交互性的技術(shù),包括我們自主意識(shí)的機(jī)器人,還有我們下一代的AI,那這些關(guān)鍵詞都代表了下一代我們看到的即將到來的,我們需要關(guān)注的技術(shù)方向。
我們繼續(xù)看,介紹一系列今天給大家?guī)淼暮芎猛妫苄迈r,很有科技感的應(yīng)用之前,跟大家再分享一下我們今天有什么樣的一個(gè)技術(shù)平臺(tái)來實(shí)現(xiàn),我們需要有一個(gè)開放,我們需要有一個(gè)標(biāo)準(zhǔn),需要讓每一個(gè)人都可以去使用的這樣的一個(gè)平臺(tái),那就是NVIDIA Omniverse,大家看到我們的定位就是創(chuàng)建,模擬以及體驗(yàn)。
那這里邊有個(gè)定語,我們叫物理準(zhǔn)確的數(shù)字世界的技術(shù)平臺(tái),這是我們的一個(gè)定位。
大家看這張圖,其實(shí)有非常多的內(nèi)容,我們以數(shù)字工廠這樣一個(gè)數(shù)字化孿生世界作為一個(gè)示范,大家可以看到,我們?nèi)绾稳グ阉鼊?chuàng)建出來。同時(shí)利用一些(技術(shù)),比如說AI,比如說我們的圖形學(xué)渲染,比如我們各類的實(shí)時(shí)光線追蹤等等一些記錄技術(shù)的集合,才能夠真正實(shí)現(xiàn)物理準(zhǔn)確。
那這里面可以看到,我們以前大家看到,過去一些年都是互聯(lián)網(wǎng),是2D的互聯(lián)網(wǎng),那么現(xiàn)在即將到來的,給我們帶來更大意義的是3D的互聯(lián)網(wǎng),那所以這些技術(shù)是非常能夠幫助到我們的工廠,幫助到我們的設(shè)計(jì)師,能夠符合剛剛我上一頁介紹的,下一代我們的AI,下一代數(shù)字時(shí)代的這些技術(shù),所以這是我們的定位。
我們的下面給大家?guī)砹艘恍┖芎猛娴膽?yīng)用,首先關(guān)注的是我們的新的創(chuàng)作方式,大家可能經(jīng)常會(huì)聽到UGC,PGC,現(xiàn)在的AIGC,這些都是我們的創(chuàng)作者們給大家?guī)淼囊恍┫盗行碌母拍�,我們看看今天給大家?guī)淼囊粋(gè)新的創(chuàng)作形式。
這是我們2019年我們的同事展示的這么一個(gè)創(chuàng)作的過程,大家看到其實(shí)我們做的實(shí)際上是2019年,當(dāng)時(shí)是紀(jì)念阿波羅登月的一個(gè)紀(jì)錄片,這里展示的技術(shù),大家可以看到,我們的同事用自己這樣的一個(gè)動(dòng)作,那它是怎么樣去把它動(dòng)作傳導(dǎo)到這樣的一個(gè)數(shù)字環(huán)境中的,傳統(tǒng)的其實(shí)就是用很精密的Mocap的設(shè)備來去把它給記錄下來,現(xiàn)在大家可以看到就用ipad,用算法,這個(gè)算法叫AI post的算法,它可以把我們同事肢體的動(dòng)作可以識(shí)別出來,映射和傳遞到我們想要的數(shù)字的虛擬環(huán)境中。
大家可以看到,這個(gè)里面都是同步的,同時(shí),還可以實(shí)現(xiàn)實(shí)時(shí)的,下面的這一個(gè)鏡頭可以看到我們很多的這些內(nèi)容,所以這些技術(shù)都是我們看到的,大家可以看一下,做的這些動(dòng)作,這些肢體的抓取是非常精確,這個(gè)實(shí)現(xiàn)了很多很多我們過去非常非常長(zhǎng)的,生產(chǎn)設(shè)計(jì)的周期,用這種算法的方式來去實(shí)現(xiàn),所以這個(gè)是我給大家介紹新的創(chuàng)作方式。
那么再看一下,剛剛提到了PGC和AIGC,我們也帶來了最新的內(nèi)容,我先把視頻放完,大家先去欣賞一下,大概兩分鐘。
大家看到了這一段視頻,我給大家展示一下這里邊非常復(fù)雜的幾個(gè)技術(shù)環(huán)節(jié),大家看到鵝,這個(gè)鵝做的翅膀的一個(gè)動(dòng)畫,這個(gè)動(dòng)畫是非常難以做的,我們這里邊就有一個(gè)非常自動(dòng)的動(dòng)畫系統(tǒng),還有一個(gè)就是大家看到機(jī)甲戰(zhàn)士,機(jī)甲戰(zhàn)士他在航母艦上,整個(gè)奔跑的動(dòng)作,肢體語言,就是我剛剛介紹的AI post的一些算法,不需要特別復(fù)雜的設(shè)備,你可以去識(shí)別,去抓取,通過算法來去生成他這些所有的跑動(dòng)的動(dòng)作。
第三個(gè),大家可以看到片頭的時(shí)候,有一段航母非常顫抖的鏡頭,這個(gè)鏡頭都是我們的平臺(tái)內(nèi)置的算法做到的,而不是你模擬,很難模擬出來的,那我剛剛也提到了,有一個(gè)技術(shù)詞匯就是物理準(zhǔn)確,這也是一個(gè)非常有意思的技術(shù)點(diǎn)。
還有一個(gè)鏡頭就是大家看到,我們的戰(zhàn)斗機(jī),那個(gè)戰(zhàn)斗機(jī)應(yīng)該是F14戰(zhàn)斗機(jī)在翻滾的時(shí)候,我們的藝術(shù)家和設(shè)計(jì)師里面放了一些小的彩蛋,大家看到,有很多什么蔥,什么洋蔥,他在那翻滾,實(shí)際上我們想去給大家展示一個(gè)技術(shù)實(shí)踐可能,就是以前這些都是一套動(dòng)畫來去模擬它,那我們現(xiàn)在技術(shù)平臺(tái)里有一個(gè)重力感應(yīng)鍵,你可以把它打開,就可以去實(shí)現(xiàn)在計(jì)算在戰(zhàn)斗機(jī)翻滾的過程中的那種失重的狀態(tài),所以這些一系列的這些技術(shù)可以都給大家去展示出來。我可以告訴大家,這個(gè)其實(shí)是很快的時(shí)間就可以做出來的,這些技術(shù)難度,如果用傳統(tǒng)的流程來去做,會(huì)非常的長(zhǎng)和復(fù)雜。我們現(xiàn)在基本上可以縮短到1/10的時(shí)間,那是給大家提供這樣的一個(gè)分享。
那第三塊應(yīng)用,大家可以看到,現(xiàn)在非�;鸬木褪菙�(shù)字人,包括數(shù)字形象。我們現(xiàn)在這部分的內(nèi)容,其實(shí)也給大家去展示了,我們?nèi)绾斡眉夹g(shù)更快,更好地去制作,同時(shí)我們?nèi)绾我階I的能力,讓大家從這種非常非常重復(fù)的工作中解脫出來,大家可以看到,這個(gè)大家可能都知道,我們?cè)贕TC上,我們大會(huì)上,我們創(chuàng)始人做Digital Jensen到Toy Jensen的過程,大家看到所有的過程,我們已經(jīng)展示了我們?nèi)绾胃�,更好地來去把超寫�?shí)數(shù)字人的工作,整個(gè)的流程縮短到最極致,大家看到其實(shí)我們?cè)贒igital Jensen上放了14秒,但實(shí)際上我們整個(gè)在后面做了整個(gè)五分鐘的視頻。
其實(shí)五分鐘基本上是一個(gè)好萊塢大片制作特效的這么一個(gè)標(biāo)準(zhǔn)的時(shí)長(zhǎng),大家知道五分鐘的特效基本上可能會(huì)用上百人的團(tuán)隊(duì)可能需要至少六個(gè)月,甚至八個(gè)月的時(shí)間完成,那我們做的這一段引入的這些技術(shù),大家猜一猜,其實(shí)我可以告訴大家,我們用了七天就做完了,怎么做到的,就是這張圖,大家看一下黃顏色的三個(gè)算法,叫Audio 2 face,Audio 2 gesture,包括Face Video 2 video,大家看其實(shí)前面兩個(gè),Audio 2 face,Audio 2 gesture,就像我今天演講一樣,其實(shí)未來有可能用這種算法,用語音的輸入,來去驅(qū)動(dòng)我面部的動(dòng)作,語音的輸入驅(qū)動(dòng)我的肢體語言,這樣的算法,包括后面的FaceVideo 2 video就相當(dāng)于大家看到我們掃描的模型其實(shí)沒有那么真實(shí)。
那我們通過一個(gè)算法可以把我們創(chuàng)始人演講的“照片”去映射到3D的模型上,這樣用算法實(shí)現(xiàn)的這種超寫實(shí)的數(shù)字形象,數(shù)字人會(huì)制作得非常快,所以過程是想告訴大家,我們可以通過新的技術(shù)把傳統(tǒng)的流程縮短到極致。
這里我們也給大家展示數(shù)字人制作的這種非常精致的這種狀態(tài)。這里邊有毛發(fā)系統(tǒng),包括很多的這些皮膚材質(zhì),所有的光照的一些模擬,大家都可以看到,通過軟件來去做到。
其實(shí)我們已經(jīng)進(jìn)入了技術(shù)的成型期,都可以幫助大家實(shí)現(xiàn)到這個(gè)級(jí)別。我們?cè)倏矗绻辛藬?shù)字人的非常精致和超寫實(shí)的形象這種狀態(tài),如何去幫助大家走到下一步,讓人動(dòng)起來,這里給大家?guī)韯倓偽姨岬降囊恍├�,這個(gè)視頻里面很有趣,其實(shí)就是一段生日歌來去驅(qū)動(dòng)犀牛的表情。
大家聽到這歌就知道這是一個(gè)女孩兒唱的,我給大家分享視頻幕后的故事,她是一個(gè)六歲的女孩兒,通過很短的時(shí)間,把自己錄的生日歌通過我們的算法來去驅(qū)動(dòng)他最喜歡的這些動(dòng)畫犀牛的角色,制成的視頻,這段視頻在她父親的生日當(dāng)天送給他。
所以這個(gè)例子,給大家分享的就是我們期待,會(huì)讓更多的普通人去做,能夠有能力去設(shè)計(jì)屬于你自己的數(shù)字化作品,這是AI的算法來完成的,也是我們的理念,讓我們的技術(shù)門檻降低。
我們?cè)倏�,在最后結(jié)束之前,我再給大家分享兩個(gè)我個(gè)人認(rèn)為比較顛覆性的技術(shù)。
首先看第一個(gè)技術(shù),大家看工具叫GauGAN 2,我們看視頻就能知道他能夠做到什么,這里面看到用輸入一些文字,那這個(gè)算法就可以去理解這段文字,并且去生成對(duì)應(yīng)文字語義的,真實(shí)的照片,就是我們已經(jīng)實(shí)現(xiàn)的,這叫GauGAN。
大家看到畫筆,算法都可以結(jié)合起來,我們很多開發(fā)者管這個(gè)算法叫“神筆馬良”,這個(gè)工具是免費(fèi)使用的,大家可以上我們的官方網(wǎng)站來去體驗(yàn)它。
第二個(gè)顛覆性的小技術(shù),我們叫3DMoMa的算法,大家看這段視頻,可以知道,剛剛我們說有了算法生成圖片,那我們有了圖片,我們是不是可以生成三維,大家可以看到這里邊我們生成的3D模型,120多張圖片,用算法生成的,不是CAD軟件做的,那我們生成的3D模型還可以編輯它的材質(zhì),還有它的光照的信息,還有物理屬性信息,這個(gè)就是一個(gè)非常顛覆性的,2D轉(zhuǎn)3D的這樣的一個(gè)算法生成的應(yīng)用,希望給大家?guī)矸浅6嗟男碌膯l(fā),讓大家的制作更加快速、更加的便捷、更加的真實(shí)、更好、更落地。
我最后跟大家總結(jié)一下,今天和大家分享的內(nèi)容,那我們的NVDIA Omniverse有三件事情可以跟大家分享。
第一,我們期待著通過一系列的技術(shù),降低門檻,讓每一個(gè)普通人成為數(shù)字內(nèi)容的創(chuàng)建者。
第二,我們非常關(guān)注工程化的技術(shù),所以剛剛我們?cè)趲讉(gè)應(yīng)用案例里跟大家都分享了物理準(zhǔn)確,基于物理,物理準(zhǔn)確。
第三,我們非常全面的去擁抱AI。
最后這段話也分享給大家,人工智能從根本上改變了軟件可以制作什么,以及你如何去制作軟件。
好的,今天我分享的內(nèi)容就是這些,希望有更多的時(shí)間和朋友們一起交流,我們的新技術(shù)如何去在數(shù)字化世界創(chuàng)建的過程中顛覆未來,顛覆以前傳統(tǒng)的技術(shù)。那今天,我的演講內(nèi)容就到此結(jié)束了,謝謝大家。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...