[No.X001-2]
11月27日,在2022全球人工智能技術(shù)大會(huì)上,由CAAI智能傳媒專委會(huì)、中國(guó)傳媒大學(xué)媒體融合與傳播國(guó)家重點(diǎn)實(shí)驗(yàn)室、新浪AI媒體研究院聯(lián)合支持的“融合與發(fā)展”新智者·智能媒體專題論壇在線上舉行。中國(guó)傳媒大學(xué)媒體融合與傳播國(guó)家重點(diǎn)實(shí)驗(yàn)室大數(shù)據(jù)中心首席科學(xué)家沈浩教授分享了《計(jì)算重塑媒介的延伸》,在他看來(lái),當(dāng)人們探索媒介,智能與物質(zhì)世界的融合延伸時(shí),人類對(duì)局限性的理解將打破,將開(kāi)啟新的視野。
圖注:沈浩教授-“融合與發(fā)展”新智者·智能媒體專題論壇
以下是沈浩分享實(shí)錄,內(nèi)容經(jīng)編輯略有刪減:
沈浩:在線的朋友們大家好,非常高興參加這樣的智能媒體專題論壇。
我今天演講主題是《計(jì)算重塑媒介的延伸》,這個(gè)話題實(shí)際上就是說(shuō)媒介最早是人的延伸,但是今天的計(jì)算讓人進(jìn)一步延伸。這個(gè)延伸可以有充分的想象,是我們智能媒體驅(qū)動(dòng)下的媒介延伸,也許是虛擬數(shù)字人,也許是元宇宙。但是作為媒體融合與國(guó)家重點(diǎn)實(shí)驗(yàn)室,我們主要承擔(dān)著關(guān)于思考媒介的未來(lái)媒體形態(tài),媒介的服務(wù)模式,媒體的智能信息處理與國(guó)際傳播問(wèn)題。
前段時(shí)間參加了非常小規(guī)模的人工智能與國(guó)際傳播論壇,當(dāng)時(shí)參加這個(gè)論壇大家會(huì)思考說(shuō)人工智能和國(guó)際傳播有什么樣的關(guān)系。
為了應(yīng)景當(dāng)時(shí)找了三個(gè)叫做“化身”或者“數(shù)字人”,他可以用多種語(yǔ)言,從口唇、姿勢(shì)、形態(tài),最重要的是自然語(yǔ)言生成,即直接用文本生成一段視頻,這段視頻幫助我們解讀了想表達(dá)的內(nèi)容。所以在科學(xué)和藝術(shù)融合時(shí)代,媒介是一種可穿戴設(shè)備,未來(lái)可穿戴設(shè)備可能是一種媒介。
1964年麥克·盧漢在《理解媒介》時(shí)特別關(guān)注到了媒介是人身體的延伸,這句話對(duì)于麥克·盧漢來(lái)講,大家說(shuō)他瘋言瘋語(yǔ)。但是他提出的媒介即信息,那什么是信息?實(shí)際上這里還有一個(gè)趣事:他當(dāng)時(shí)提到,媒介即按摩。
所以,今天信息減少和排除事物不確定性度量,如果你進(jìn)到屋里但是是黑燈狀態(tài),那打開(kāi)燈后你才能找到你的東西,這時(shí)候電燈給了你決策,因此電燈是不是媒介?今天當(dāng)你受傷或者失戀了,聽(tīng)首歌也許就撫慰了你受傷的心靈,這個(gè)時(shí)候媒介是不是就是按摩?所以麥克·盧漢的媒介信息論和媒介技術(shù)論,技術(shù)在驅(qū)動(dòng)媒介方面發(fā)揮重要作用。
當(dāng)然,今天最重要的是計(jì)算。計(jì)算的核心要素是數(shù)據(jù)算法和算力,數(shù)據(jù)已經(jīng)成為重要的生產(chǎn)要素。前段時(shí)間中央電視臺(tái)的央視新聞做了關(guān)于“數(shù)字人”的采訪,當(dāng)時(shí)我在今日頭條包括學(xué)習(xí)強(qiáng)國(guó)進(jìn)行解讀之后,幾個(gè)小時(shí)大概有四十幾萬(wàn)的點(diǎn)擊量,說(shuō)明大家非常關(guān)注媒介延伸以及數(shù)字人。
很多場(chǎng)景下都會(huì)做一個(gè)數(shù)字人和媒介重塑融合延伸的方式�;谶@個(gè)方式你會(huì)發(fā)現(xiàn),在制作這樣方式中大家可能更想的是:最好是你沈老師出現(xiàn),包括形象、語(yǔ)音等。相信大家知道只要我們給出草本或者腳本,選擇你的化身也就是演員,然后不同的背景無(wú)論是圖片或者是視頻就自動(dòng)合成從文本到視頻的生成。
而且這樣的“化身人”可以讀200多種語(yǔ)言或語(yǔ)種,還可以選擇不同身份的人,這其實(shí)是我們?nèi)斯ぶ悄茉谧匀徽Z(yǔ)言處理、自然語(yǔ)言生成和自然語(yǔ)言理解上有了極大的進(jìn)步。
這也是一個(gè)令人興奮的時(shí)代,是大數(shù)據(jù)時(shí)代,人工智能和數(shù)據(jù)科學(xué)讓我們?cè)絹?lái)越多地觀察到人類社會(huì)的復(fù)雜行為模式。當(dāng)下是科技聚合時(shí)代,不僅是人工智能還包括區(qū)塊鏈、北斗、NFT、5G、元宇宙。今天,主要關(guān)注在媒體,所以課題主要關(guān)注虛擬數(shù)字人和媒體融合視角。
比如,今天開(kāi)一個(gè)騰訊會(huì)議,大家都希望能開(kāi)一個(gè)具有沉浸感的會(huì)議調(diào)劑一下,這件事其實(shí)已經(jīng)出現(xiàn)了。當(dāng)我走入這樣的環(huán)境中可以看到我身旁可能是賣的NFT,也可能將來(lái)是媒體融合數(shù)字博物館,也許是其他可能的影視等分享。
舉個(gè)例子可以在這看出來(lái),比如我搭建這樣一個(gè)環(huán)境,只要在這這上傳視頻、音頻或者可能實(shí)現(xiàn)交互方式,有人來(lái)這一起欣賞、購(gòu)買等等模式。從這個(gè)角度來(lái)講,不光可以坐這開(kāi)會(huì),也可以體驗(yàn)新的交互模式。
最近有一些從文本到視頻,甚至文本到圖片的頂級(jí)算法叫穩(wěn)定創(chuàng)新。這六張圖真的是沈老師畫(huà)的,但不是我畫(huà)的,我只要給出關(guān)鍵詞就可以生成這樣的圖片。特別像這張大圖,當(dāng)時(shí)我輸入的是三個(gè)宗教,基督教、伊斯蘭教和佛教,結(jié)果生成中間張圖,可以看到既有基督教的特色也有伊斯蘭教的服飾,甚至也有佛教的表情,當(dāng)然不同的人有不同的解讀。
從這個(gè)角度,我們的藝術(shù)家很難創(chuàng)作出這樣一種寓意,但是當(dāng)一個(gè)老人在車上玩手機(jī)時(shí)會(huì)生成這樣的圖片。人工智能直接從文本到圖像、視頻,已經(jīng)進(jìn)入我們的藝術(shù)領(lǐng)域。
今天已經(jīng)可以把各種圖像、視頻抓幀包括語(yǔ)言圖像等等都可以變成相量化,當(dāng)把我們的手寫(xiě)或者服裝變成嵌入相量,包括把表情變成相量時(shí),通過(guò)科技聚合在一起一定會(huì)產(chǎn)生化學(xué)反應(yīng)。這種反應(yīng)可能是媒體融合的特征也是媒體融合需要最關(guān)注的特點(diǎn)。當(dāng)然這個(gè)特點(diǎn)對(duì)于我們學(xué)校,對(duì)于國(guó)家媒體融合與傳播來(lái)源講實(shí)際上是建立在新文科、新工科,特別具有交叉學(xué)科特點(diǎn)。
就是對(duì)于傳統(tǒng)的硬科學(xué),大數(shù)據(jù)和人工智能與今天的人文社會(huì)科學(xué)融合,這個(gè)時(shí)候就可以產(chǎn)生有組織的科研創(chuàng)新。所以計(jì)算和傳播可能在重塑我們的媒介觀。
這里用了虛幻引擎(metahuman),可以在象素級(jí)上進(jìn)行數(shù)字人的描繪或者生成�,F(xiàn)在最難的是虛幻引擎還不能脫離優(yōu)異的引擎。同樣我們看到在強(qiáng)大的智能和算力上,英偉達(dá)的黃教主實(shí)現(xiàn)了和人形象的代言和形象的交流,這一點(diǎn)我們看到數(shù)字人已經(jīng)聚合了智能技術(shù),同時(shí)也在聚合媒體融合的形態(tài)。
所以,我們學(xué)校也在一些特定場(chǎng)景、活動(dòng)中用數(shù)字人方式,去表達(dá)一些形態(tài),就像學(xué)生不能蒞臨現(xiàn)場(chǎng)一樣,比如在疫情期間,我們學(xué)校動(dòng)漫學(xué)院利用一個(gè)虛擬的元宇宙畢業(yè)典禮或者開(kāi)學(xué)典禮。
今天,元宇宙是一個(gè)熱門(mén)話題,但是它是一種數(shù)據(jù)形態(tài)。
未來(lái)我們每個(gè)人可能都希望有個(gè)“網(wǎng)絡(luò)化身”,這個(gè)“化身”在不同的現(xiàn)實(shí)物理世界,因世界的價(jià)值觀不同可以享受不同生活方式。
所以,站在交叉學(xué)科和社會(huì)科學(xué)視角,技術(shù)往往遮蔽在文化中,只有當(dāng)技術(shù)產(chǎn)生革命性變革時(shí)人們才會(huì)意識(shí)到技術(shù)的重要性。
前面兩位專家提到了未來(lái)的可能性,不光在現(xiàn)實(shí)中,可能未來(lái)在無(wú)人機(jī),特別是主機(jī)和僚機(jī)作用中互相的感知連接。未來(lái)很多領(lǐng)域這種認(rèn)知性東西實(shí)際上是技術(shù)在驅(qū)動(dòng)媒介產(chǎn)業(yè)和社會(huì)變革。這種社會(huì)變革,除了區(qū)塊鏈、納米技術(shù)、人工智能技術(shù)、機(jī)器人、人工存儲(chǔ)等等,其實(shí)我們看到現(xiàn)在很多時(shí)髦概念撲面而來(lái)。
2002年時(shí),美國(guó)提出了科技聚合,當(dāng)時(shí)它提到了納米、信息技術(shù)等等。但是今天我特別想說(shuō)認(rèn)知科學(xué),如果人工智能能夠涉足認(rèn)知科學(xué),這種認(rèn)知問(wèn)題如何解決,博弈也是種認(rèn)知,媒體技術(shù)具有驚人的潛力來(lái)提升我們與世界的互動(dòng)方式。
最早人類因?yàn)橛幸粋(gè)洞穴的隱喻,不知道外面世界是什么,只能通過(guò)投影感知世界。但是今天,我們也許可以創(chuàng)造出一個(gè)世界,也許是元宇宙,也許是媒體融合的延伸,也就是計(jì)算讓我們媒體的進(jìn)一步延伸。延伸到了今天我們?cè)敢庥迷钪娣绞饺ヌ接�,�?dāng)我們探索媒介和智能與物質(zhì)世界的融合創(chuàng)新、融合延伸時(shí),我們的認(rèn)知局限性理解將會(huì)打破。
特別是智能技術(shù),所以,希望開(kāi)拓新的視野。從最小的叫做智能地去除背景技術(shù)到智能地擦除和合成技術(shù),這些對(duì)于媒體來(lái)講都是小兒科。甚至對(duì)于視頻的融合采集和智能編輯技術(shù)也已經(jīng)非常地方便。只要在算力達(dá)到的情況下,我們就可以給受眾,甚至抖音里面的剪影,包括微博視頻等都有這類技術(shù)出現(xiàn)。
視覺(jué)是人工智能創(chuàng)新最典型的要點(diǎn)和突出點(diǎn),除了我們拿到圖像去構(gòu)建圖像的相量化、預(yù)項(xiàng)量模型以外,現(xiàn)在我們對(duì)于圖像的反向搜索,對(duì)于圖像的事實(shí)審核問(wèn)題就非常重要了。
隨著我們對(duì)于輿論戰(zhàn)、認(rèn)知戰(zhàn)的認(rèn)知,需要更多地對(duì)網(wǎng)上包括社交媒體上出現(xiàn)的大量的圖像和視頻進(jìn)行事實(shí)的審核和追蹤。同樣道理,通過(guò)一個(gè)帶有計(jì)算機(jī)視覺(jué)的攝像頭就可以很容易的快速地捕捉停車場(chǎng)的占位和空位。過(guò)去我們需要大量的設(shè)備傳感器電子和人力,今天一個(gè)攝像頭就可以感知并做到這一點(diǎn)。
從這一點(diǎn)來(lái)講,隨著攝像頭技術(shù)、視覺(jué)技術(shù)以及追蹤能力的進(jìn)步,我們可以以一張照片大概算出具體的人群是什么,很多場(chǎng)景都會(huì)用這樣的算法來(lái)捕捉可能人數(shù)的感知。
對(duì)于圖像修復(fù)技術(shù),無(wú)論是從舊相片、破損相片還是黑白照片的著色都有了很好的能力,甚至現(xiàn)在很多媒體都將過(guò)去的視頻或者圖像進(jìn)行了相應(yīng)的著色和升頻能力,甚至達(dá)到8倍的升頻技術(shù)。從靜態(tài)到2D、3D,讓清明上河圖活躍起來(lái),讓特殊場(chǎng)景下的一些圖片變得動(dòng)態(tài)這也是可能的應(yīng)用場(chǎng)景。
這樣的技術(shù)出來(lái)以后,也帶來(lái)了很多深度造假,當(dāng)然深度造假隨著現(xiàn)在的穩(wěn)定擴(kuò)散模型出現(xiàn),深度造假又上了臺(tái)階,它既有負(fù)向也有正向應(yīng)用,這塊算法和能力主要關(guān)注于如何應(yīng)用起來(lái)更好地服務(wù)人們的需要。最典型的是從智能主播的方式,通過(guò)虛擬數(shù)字人方式呈現(xiàn)。
對(duì)于媒介來(lái)講,借助于智能媒體實(shí)際上已經(jīng)成為了重要的社會(huì)使能器,是社會(huì)互動(dòng)的使能器。人們通過(guò)智能媒體獲取信息知識(shí),應(yīng)對(duì)未知和恐懼。
所以,現(xiàn)在在媒體領(lǐng)域普遍流行的就是創(chuàng)建各種各樣的數(shù)字人,也形成了相應(yīng)的產(chǎn)業(yè)鏈。這些產(chǎn)業(yè)鏈很重要的關(guān)鍵技術(shù)就是我們的智能技術(shù),就是我們的智能媒體技術(shù),這里面既包括圖像、視頻、語(yǔ)言、聲音、文字甚至細(xì)節(jié)上包括自然語(yǔ)言理解和生成,甚至是主體對(duì)象的實(shí)時(shí)追蹤都是很重要的方向。這些領(lǐng)域會(huì)滲透到不同的輿論產(chǎn)業(yè),甚至包括新聞傳播。
前段時(shí)間做了虛擬數(shù)字人影響力報(bào)告,也得到很重要的大家反饋。通過(guò)反饋中知道媒介的延伸使我們更好地了解自己、感知世界,媒介的智能在塑造我們現(xiàn)實(shí)世界中起著非常重要的作用。
這時(shí)候,人類的認(rèn)知正在迅速地接近使用計(jì)算和數(shù)據(jù)、算法、算力去融合、交互。這個(gè)過(guò)程中計(jì)算和傳播成為未來(lái)媒體的核心技術(shù)。
我特別提到,關(guān)于媒體融合與國(guó)家重點(diǎn)實(shí)驗(yàn)室,為了建立對(duì)國(guó)家戰(zhàn)略服務(wù)需求,實(shí)際上現(xiàn)在我們不僅在信息戰(zhàn)還有輿論戰(zhàn),最近主要是在認(rèn)知戰(zhàn)上,認(rèn)知戰(zhàn)對(duì)我們的智能技術(shù)使用就更重要了。比如俄烏沖突中人臉識(shí)別,把相應(yīng)陣亡士兵能夠寄回到他的家里,引起認(rèn)知上的改變。以及各種造假形成對(duì)相應(yīng)的戰(zhàn)爭(zhēng)影響以及在社交媒體上和其他媒體上傳播的問(wèn)題,都需要我們用更加有效的智能技術(shù)來(lái)解決。
這種智能技術(shù)不僅包括我們對(duì)物體感知,對(duì)社會(huì)認(rèn)知,特別是他們的關(guān)系的理解。這種關(guān)系需要通過(guò)不同的智能技術(shù)來(lái)解讀,通過(guò)智能技術(shù)來(lái)分析,這種智能技術(shù)其實(shí)來(lái)自于我們的開(kāi)源情報(bào)等網(wǎng)絡(luò)搜索,包括人臉。
舉個(gè)例子,比如特朗普,就需要通過(guò)一個(gè)帳號(hào)獲取他的信息,并且把這個(gè)信息提取出來(lái)建立我們自己的認(rèn)知模型。例如通過(guò)“大五馬”模型捕捉價(jià)值需求等,這是一個(gè)多標(biāo)簽或者分類模型,它包括對(duì)語(yǔ)義、文化方面的認(rèn)知,也包括視覺(jué)效果,這個(gè)模型能夠快速地對(duì)一個(gè)人進(jìn)行分析。
既然能分析一個(gè)人,就可以分析所有人。我們可以通過(guò)GPU加速,可以對(duì)更大的社會(huì)群體認(rèn)知產(chǎn)生群體分析。這樣的分析也可以推進(jìn)我們?nèi)斯ぶ悄軇?chuàng)新,推進(jìn)技術(shù)聚合,找到新的思考方式。
所有事物都這樣被連接,可計(jì)算。如果用一些數(shù)學(xué)形式的語(yǔ)言來(lái)表達(dá),數(shù)據(jù)、算法和算力構(gòu)成了我們計(jì)算的要素。一個(gè)計(jì)算可編程是智能,因?yàn)槿斯ぶ悄塥M義的定義就是一段可編程的智能化程序,這個(gè)智能未來(lái)和區(qū)塊鏈融合,將會(huì)產(chǎn)生未來(lái)社會(huì)的一種模式。
也就是把今天的信息互聯(lián)網(wǎng)和價(jià)值互聯(lián)網(wǎng)融合,產(chǎn)生新的數(shù)字經(jīng)濟(jì)形態(tài)。
這個(gè)過(guò)程中,一個(gè)很重要的社會(huì)治理就是需要人工智能和數(shù)據(jù)智能的能力。因此,云計(jì)算、大數(shù)據(jù)、人工智能等自變量里構(gòu)建未來(lái)的區(qū)塊鏈,把現(xiàn)在很多新的技術(shù)如何融合構(gòu)建我們可想象的,比如元宇宙這樣的未來(lái)形態(tài)。
技術(shù)融合,計(jì)算賦能認(rèn)知不僅僅視為一種技術(shù),更認(rèn)為人類意識(shí)或者認(rèn)知的延伸。這種延伸中媒體融合不斷創(chuàng)新,進(jìn)一步推進(jìn)了技術(shù)的融合,擴(kuò)大視野尋找新的思考方式。
最后總結(jié),我們一直在探討,盡管我們有很多的信息,但是如果加上時(shí)間,當(dāng)我們的信息被時(shí)間和位置捆綁時(shí),加上Hash捆綁就可以實(shí)現(xiàn)自辨真家,無(wú)假自證.也就是我們的位置,盡管在國(guó)界內(nèi)有三大運(yùn)營(yíng)商,但是如果逃離了國(guó)界,那么你在全球地理位置還有北斗衛(wèi)星。如果北斗可以實(shí)現(xiàn)雙向短報(bào)文,并且實(shí)現(xiàn)全球授時(shí)和全球授位時(shí),那么,你發(fā)個(gè)信息都被我的時(shí)間和位置捆綁,那你就是中國(guó)的。
當(dāng)然,如果你逃離到未來(lái)的元宇宙中,你能夠被我的時(shí)間和位置捆綁,如果能夠被我們的關(guān)系捆綁,真的無(wú)假自證。對(duì)于元宇宙的未來(lái)和社會(huì)治理,我們可能可以看到一種希望的主張,對(duì)于全球的空間、時(shí)空和我們的人類行為,包括我們的媒體、語(yǔ)言、文字、聲音進(jìn)行Hash捆綁,都可能產(chǎn)生新的一種價(jià)值,這是今天我想表達(dá)的。
今天我的主題叫做計(jì)算重塑媒介的延伸,我們努力將未來(lái)變成現(xiàn)實(shí),謝謝大家!
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...