您的位置: 首頁 >互聯(lián)網(wǎng) >

使用這款基于AI的網(wǎng)絡(luò)應(yīng)用程序 將任何圖像與虛構(gòu)的音景相匹配

2019-05-14 11:24:43 編輯: 來源:
導(dǎo)讀 聲音可以令人驚嘆地喚起; 我們遠離辦公室和家庭,坐在陰涼的森林中潺潺流淌的小溪旁邊,或在暴露的山邊顫抖。但日本研究人員的一個新項目

聲音可以令人驚嘆地喚起; 我們遠離辦公室和家庭,坐在陰涼的森林中潺潺流淌的小溪旁邊,或在暴露的山邊顫抖。但日本研究人員的一個新項目利用了這種富有想象力的潛力,并將其與人工智能相結(jié)合,實現(xiàn)了神奇的效果。由此產(chǎn)生的網(wǎng)絡(luò)應(yīng)用程序 - “ Imaginary Soundscape ” - 使用機器學(xué)習(xí)來匹配您上傳的任何圖片以及合適的音頻配對。

例如,上傳日本木刻的漁船,系統(tǒng)提供波浪和水聲; 加載夜鶯的抽象畫,你會得到風鈴和鳥兒的花園音景。通常結(jié)果正是你所期望的,但更有趣的是當系統(tǒng)選擇你可能沒有想到的圖片中的元素時(比如將威震天與拖拉機聲音配對),或者根本沒有任何意義(如這幅畫的手與現(xiàn)場體育比賽的聲音相匹配)。

一些快速提示:當您上傳藝術(shù)作品,人類活動照片和抽象圖像時,您往往會獲得有趣的結(jié)果。上傳模因只會讓機器感到困惑。

所有這些都是相對簡單的AI機制的產(chǎn)物。它使用對象識別來識別圖像中的元素,然后將這些元素與超過52,000個聲音文件的數(shù)據(jù)集進行匹配。負責的研究人員Yuma Kajihara,Shoya Dozono和Toky的Nao Tokui多年來一直在研究這種“交叉模式”模型。早期版本的Imaginary Soundscapes于1月份推出,用于將音頻與Google街景圖像進行匹配,您可以閱讀Tokui的這篇博文,了解該項目的更多背景知識。(他引用Brian Eno作為靈感。)

這是一個有趣的小應(yīng)用程序,是AI支持的新型創(chuàng)意表達的絕佳示例。系統(tǒng)并不完美 - 異議識別會產(chǎn)生錯誤,聲音數(shù)據(jù)庫也不可避免地不完整 - 但這是魅力的一部分。如果有的話,它產(chǎn)生的偶然和意外的音景比“正確”的比賽更有趣。請在下面的評論中告訴我們您的配對。


免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。