您的位置: 首頁 >科技 >

AI合成技術(shù)正在通過各種智能設(shè)備實現(xiàn)并應用

2022-07-30 10:28:20 編輯:高達倫 來源:
導讀 近日,百度地圖推出了定制化語音導航功能,簡單說就是用戶根據(jù)提示采集原聲,十幾分鐘后你將獲得屬于自己定制化的語音導航音頻包。所以說用...

近日,百度地圖推出了定制化語音導航功能,簡單說就是用戶根據(jù)提示采集原聲,十幾分鐘后你將獲得屬于自己定制化的語音導航音頻包。所以說用戶除了郭德綱、林志玲、羅振宇……這一票人之外還有更多選擇。其實我們在使用明星導航音頻包時會發(fā)現(xiàn),除了很多“左轉(zhuǎn)”“紅綠燈路口”這類常規(guī)交通詞匯外,很多涉及地名的、地標的詞是可以聽的出是合成的。而現(xiàn)在“語音合成”技術(shù)推向普通用戶,就有了這些AI定制化合成服務。

單從使用AI合成的相關(guān)App來看,不禁聯(lián)想到那個“一夜而紅”的ZAO,還有國外的Deepfake,AI脫衣軟件DeepNude等等。而國內(nèi)專注于人工智能領(lǐng)域的企業(yè)越來越多,例如:商湯科技、曠視科技這兩艘“AI巨輪”的業(yè)務主要是對政府及企業(yè)的;而科大訊飛、大疆、華為、小米、優(yōu)必選科技的部分硬件類業(yè)務是to C類的;極鏈科技是專注于視頻領(lǐng)域的人工智能企業(yè),業(yè)務面向品牌主及流量方,也就是to B類的。

對于廣大 C端 用戶來說,AI合成技術(shù)正在通過各種智能設(shè)備實現(xiàn)并應用。比如地圖AR增強,定制化音頻服務、定制化視頻服務、專屬智能客服等。

其實剛才提到過的曾經(jīng)爆火的這些App應用,“ZAO”、“Deepfake”、“DeepNude”技術(shù)上有些共同之處,但是的點不同。“DeepNude”涉及色情內(nèi)容,并上升到人身攻擊最終被禁止。網(wǎng)友用“Deepfake”在網(wǎng)上大量惡搞政府首腦,比如的惡搞視頻眾多。

而離我們最近的“ZAO”,在有了前車之鑒后,看的出在盡可能規(guī)避可能產(chǎn)生的負面效果,視頻素材內(nèi)容由平臺方把控。但不可避免的是在用戶對照片進行授權(quán)所涉及的隱私問題,因為不單純是上傳照片即可,而是需要用戶多角度的認證,有些“恐慌”確實不可避免,因為掃臉支付、掃臉登陸等功能已經(jīng)被廣泛應用,這是用戶最直接的對“ZAO”開發(fā)者的質(zhì)疑。隨后不久背后的公司陌陌科技被有關(guān)部門談話并要求整改,目前來看在ios的熱度及下載量仍然穩(wěn)定在前三名。

不再處于風口浪尖,“ZAO”進入了平穩(wěn)期,而大家對其盈利模式以及產(chǎn)品定位仍有疑問,似乎并沒看到一個清晰的變現(xiàn)方式。雖說當前“視頻社交”火爆,但是僅憑陌陌的用戶帶動還是比較乏力的。App自身沒有社交屬性,只是單純的內(nèi)容產(chǎn)出,和其他的分發(fā)渠道聯(lián)合顯得很必要。而問題又來了,這些內(nèi)容只適合小范圍內(nèi)私域傳播,用戶不愿意擴散是關(guān)鍵。沒有爆炸傳播的潛質(zhì),所以營銷能力也被削弱。或許只是曇花一現(xiàn),但是對于用戶來說,拍照合成視頻的趣味性還是非常強的,但關(guān)于變現(xiàn)場景仍需要一段較長的摸索期。

工具類軟件更能被大家接受認可,微信中音頻轉(zhuǎn)文字功能用起來很方便,并且通過計算機的學習,準確度也在不斷提高。而科大訊飛推出的「訊飛聽見」是目前將音頻轉(zhuǎn)文字業(yè)務做的較為成熟的平臺。業(yè)務細分為機器快轉(zhuǎn)和中文人工精轉(zhuǎn)兩種服務,可直接收費變現(xiàn)。和百度地圖的定制版語音導航類似,屬于上傳后的AI處理,非在線轉(zhuǎn)化。

地圖app,作為一個相對高頻使用的工具類應用,除了在滿足常規(guī)通行服務外,正在發(fā)現(xiàn)更多的To C服務場景。比如google地圖推出的AR導航功能,已經(jīng)開始測試應用,用于幫助用戶以在線實景增強的方式判斷方向及路線。華為也正在布局地圖服務,在Cyberverse數(shù)據(jù)平臺上發(fā)了Map Kit,而相關(guān)AR技術(shù)的應用是在景區(qū)、博物館之類的場景做實景增強標注和講解服務。在2017年高德地圖就推出了景區(qū)語音導游服務,發(fā)展至今已經(jīng)比較成熟。

AI+音樂,在線音頻也一直被關(guān)注。今年7月抖音對外宣布了收購英國AI初創(chuàng)公司Jukedeck,這家公司正在研發(fā)一種技術(shù),將用人工智能創(chuàng)作音樂,對歌詞自動配樂等方面。通過AI對音樂的深度學習,滿足用戶自由選擇音樂類型、曲風、時長等要求,讓每一個用戶都能體驗到音樂創(chuàng)作的樂趣。

可以發(fā)現(xiàn),相比5年前,AI合成技術(shù)已經(jīng)不再那么神秘。而那些曾經(jīng)“紅”極一時的深度偽造類App,通常在道德、隱私、風險等方面游走規(guī)則的邊緣,似乎滿足人們原始“窺視”、“色情”、“臆想”需求的功能成了火熱表相之下的底色,或許這并不是開發(fā)者的初心,但是從環(huán)節(jié)上把控內(nèi)容的方向,依舊很有必要。

另外隱私問題開始被用戶所注重,但是隨著智能手機的普及應用,智能化的服務的增多,包括面部解鎖、刷臉交易、刷臉登陸等。過去很長一段時間用戶對App應用上的用戶數(shù)據(jù)留痕,可能無暇顧及,但是當下面部信息已經(jīng)成為了個人服務的入口,并且直接關(guān)聯(lián)用戶隱私、數(shù)據(jù)信息以及財產(chǎn)的安全性。

總體來看,AI合成技術(shù)的工具類應用是比較被用戶認可的,無論是功能性還是體驗度,相對傳統(tǒng)服務有了較大提升。專業(yè)技術(shù)對普通用戶的門檻正在降低,服務、效率、準確率、費用等因素會成為工具類應用的競爭點。


免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。