文字直接轉(zhuǎn)視頻科學(xué)家用機器學(xué)習(xí)算法實現(xiàn)這種操作

2018/02/27 13:31 鎂客網(wǎng) Lynn

　　近日，《Science》雜志公布了一項新的機器學(xué)習(xí)算法，該算法可根據(jù)文本或者碎片式的信息來重建完整的視頻，如根據(jù)證人描述重現(xiàn)事故現(xiàn)場。

　　據(jù)了解，該算法是一種小型神經(jīng)網(wǎng)絡(luò)，即一系列小型計算元素層。其主要的工作分為兩個階段：一是通過文本生成視頻的“主旨”，即一個模糊的背景圖片上加注一些重要的標(biāo)注;二通過綜合“主旨”和文本內(nèi)容產(chǎn)生一個短視頻。此外，在訓(xùn)練過程中，第二部分的網(wǎng)絡(luò)會對新增加的視頻內(nèi)容進(jìn)行反復(fù)的對比，以提升性能。

　　目前，研究人員采用了十種生活場景對其訓(xùn)練，包括在草地上打高爾夫、在海上玩風(fēng)箏沖浪等，算法生成的圖像還比較粗糙，呈現(xiàn)VHS錄像的顆粒感畫面�，F(xiàn)在，可達(dá)到高準(zhǔn)確率的視頻約為32幀，持續(xù)時間為1秒，大小為64×64像素。研究人員之一，杜克大學(xué)的計算機科學(xué)家Yitong Li解釋道，“更高的分辨率會降低其準(zhǔn)確度。”

　　雖然當(dāng)前算法生成的視頻尚十分粗糙，但是這項研究實現(xiàn)了文本直接轉(zhuǎn)視頻技術(shù)上的質(zhì)的飛躍。“這是一個非常難的問題，而他們的方法非常有趣，只要兩個階段。所以，對于他們現(xiàn)在取得的成就和突破，我感到非常高興。”馬里蘭大學(xué)計算機科學(xué)家Hamed Pirsiavash評價道。

　　比利時魯汶大學(xué)計算機科學(xué)家Tinne Tuytelaars也對此贊不絕口：“這是我所知道的第一部如此棒的文字轉(zhuǎn)視頻作品，它不完美，但至少看起來像是真正的視頻。這真的很好。”

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

　　榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

文字直接轉(zhuǎn)視頻科學(xué)家用機器學(xué)習(xí)算法實現(xiàn)這種操作

最新新聞

熱門新聞

新動態(tài)

關(guān)注度

最話題

文字直接轉(zhuǎn)視頻 科學(xué)家用機器學(xué)習(xí)算法實現(xiàn)這種操作

相關(guān)閱讀

最新新聞

熱門新聞

新動態(tài)

關(guān)注度

最話題

文字直接轉(zhuǎn)視頻科學(xué)家用機器學(xué)習(xí)算法實現(xiàn)這種操作