谷歌的目標(biāo)是超過Prisma和細(xì)分與應(yīng)用程序增加多種風(fēng)格的視頻

2022-09-14 01:05:20 編輯：聞波璧來源：

導(dǎo)讀為了不被Prisma和Artisto這樣的應(yīng)用程序超越，谷歌今天公布了一項(xiàng)新研究，使應(yīng)用程序能夠在視頻上應(yīng)用一種藝術(shù)風(fēng)格，然后根據(jù)需要切換到不...

為了不被Prisma和Artisto這樣的應(yīng)用程序超越，谷歌今天公布了一項(xiàng)新研究，使應(yīng)用程序能夠在視頻上應(yīng)用一種藝術(shù)風(fēng)格，然后根據(jù)需要切換到不同的藝術(shù)風(fēng)格。這項(xiàng)工作涉及到一種被稱為深度學(xué)習(xí)的人工智能，它表明，谷歌希望在受到應(yīng)用程序的啟發(fā)后，提升這項(xiàng)技術(shù)的水平。這些應(yīng)用程序超越了你在Instagram上看到的那些簡(jiǎn)單的照片過濾器。

該作品發(fā)布的前一天，F(xiàn)acebook演示了如何將樣式應(yīng)用到實(shí)時(shí)視頻中。

和Facebook的情況一樣，谷歌還沒有發(fā)布應(yīng)用程序，但這家搜索公司表示，它將很快開放代碼的源代碼，讓人們可以在谷歌的TensorFlow深度學(xué)習(xí)框架中試用這項(xiàng)技術(shù)。

為了做到這一點(diǎn)，谷歌正在將人工神經(jīng)網(wǎng)絡(luò)——深度學(xué)習(xí)的關(guān)鍵元素，在谷歌和其他公司越來越多的產(chǎn)品中使用——應(yīng)用到一種稱為風(fēng)格轉(zhuǎn)移的方法中。

“與以前方法快風(fēng)格轉(zhuǎn)移,我們認(rèn)為這種方法建模多個(gè)風(fēng)格同時(shí)打開車門激動(dòng)人心的新方法為用戶與風(fēng)格傳輸算法,不僅允許自由創(chuàng)造新的風(fēng)格基于其他的混合物,但要做到實(shí)時(shí),”谷歌高級(jí)研究科學(xué)家喬恩•Shlens谷歌軟件工程師的希Kudlur,和前谷歌大腦實(shí)習(xí)生文森特Dumoulin在一篇博客文章中寫道。

最初的實(shí)現(xiàn)非常緩慢。上傳一張照片——甚至不是一段視頻——你“仍然有足夠的時(shí)間在結(jié)果出來之前去喝杯咖啡，”Shlens, Kudlur和Dumoulin寫道。當(dāng)然，他們改進(jìn)了系統(tǒng)。

這項(xiàng)工作建立在去年走紅的谷歌的DeepDream系統(tǒng)之上。Prisma在今年確實(shí)經(jīng)歷了一場(chǎng)流行浪潮，而谷歌的新技術(shù)也可能會(huì)出現(xiàn)類似的情況——只要它能在相對(duì)較短的時(shí)間內(nèi)投入使用，同時(shí)Prisma的理念在人們的頭腦中仍然是新鮮的。

這可能會(huì)給谷歌帶來短期收益，但從長(zhǎng)期來看，其影響可能更為顯著。三人在一篇論文中解釋道:

我們認(rèn)為，這是一個(gè)重要的問題，如果得到解決，將具有科學(xué)和實(shí)踐的重要性。首先，樣式轉(zhuǎn)移已經(jīng)在移動(dòng)應(yīng)用程序中得到了應(yīng)用，對(duì)于移動(dòng)應(yīng)用程序，設(shè)備上的處理取決于模型是否具有合理的內(nèi)存占用。更廣泛地說，為每一種風(fēng)格建立一個(gè)單獨(dú)的[網(wǎng)絡(luò)]忽視了這樣一個(gè)事實(shí)，即個(gè)別繪畫共享許多共同的視覺元素，而一個(gè)真正捕捉藝術(shù)風(fēng)格的模型將能夠利用和學(xué)習(xí)這種規(guī)律。此外，一個(gè)藝術(shù)風(fēng)格模型在繪畫風(fēng)格中推廣的程度，將直接衡量我們建立系統(tǒng)的能力，這些系統(tǒng)可以節(jié)省地捕捉照片和圖像的更高層次的特征和統(tǒng)計(jì)數(shù)據(jù)。Olshausen, 2001)。

請(qǐng)閱讀全文。

11月1日更新:谷歌現(xiàn)在已經(jīng)開源了為一個(gè)圖像添加多個(gè)樣式的代碼。它可以在GitHub上找到。為視頻添加多種樣式的代碼將在后面給出。

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請(qǐng)聯(lián)系刪除！