2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
谷歌母公司Alphabet旗下的DeepMind過去一年損失總額達5.72億美元。作為全球規(guī)模最大的人工智能學術(shù)研究機構(gòu)之一,DeepMind在過去三年中始終虧損,累計金額已超10億美元。在未來12個月內(nèi),DeepMind還需要繼續(xù)投入超過10億美元。
這是否意味著AI技術(shù)正在走向崩潰?
這不一定。研究活動本來就相當燒錢,與一系列最頂尖的科學項目相比,DeepMind的支出只能算是“九牛一毛”。歐洲的大型強子對撞機項目每年光是維護成本就高達10億美元,最終發(fā)現(xiàn)希格斯玻色子的總成本估計將超過100億美元。而且,人們印象中的真正人工智能(也被稱為人工通用智能,簡稱AGI)這類既能玩轉(zhuǎn)《星際迷航》、又能聽懂人類表達的重量級成果,開出的價碼也絕對不會便宜。
即便如此,DeepMind逐年上升的虧損水平仍然值得關(guān)注:2016年,DeepMind虧損額為1.54億美元;2017年增長至3.41億美元;2018年則進一步提升至5.72億美元。在筆者看來,這其中包含著三大核心問題:
DeepMind是否找到了正確的科學探索方向?
從Alphabet的角度來看,這樣的投入規(guī)模是否合理?
如此可觀的虧損數(shù)字,又會給整個AI市場帶來怎樣的影響?
首先來看探索方向的問題。之所以值得討論,是因為DeepMind明顯是把雞蛋都放進了同一個籃子——也就是深度強化學習。這項技術(shù)主要用于通過模型識別將深度學習與強化學習加以結(jié)合,基于獎勵信號實現(xiàn)學習能力,從而使系統(tǒng)學會如何在游戲中獲得更高分數(shù)、或者在象棋等游戲中對抗求勝。
DeepMind的成名之作是2013年發(fā)表的一篇論文。這篇令人振奮的成果闡述了如何對單一神經(jīng)網(wǎng)絡(luò)系統(tǒng)進行訓練,以教會其游玩多款雅達利游戲(包括〈突圍〉以及〈太空入侵者〉),并最終獲得近似甚至超越人類的成績。這篇論文讓DeepMind成了AI領(lǐng)域的搖滾巨星,并成功引起谷歌方面的注意。在2014年1月被谷歌收購之后,DeepMind進一步推動技術(shù)開發(fā),先后在圍棋以及不朽神作《星際爭霸》游戲中接連取得勝利。
但問題在于,這項技術(shù)對環(huán)境有著非常具體甚至可以說是苛刻的要求。例如在游玩《突圍》時,哪怕是一丁點微小的變化,例如將鏡頭對焦位置移動幾個像素點,其性能都會受到巨大影響。DeepMind的《星際爭霸》系統(tǒng)同樣局限性明顯:在同一地圖內(nèi)使用同一種族進行對戰(zhàn),其成功確實足以超越人類;但在其它地圖使用另一種族時,成績就會快速下滑。要轉(zhuǎn)換作戰(zhàn)風格,我們必須從頭開始重新進行系統(tǒng)訓練。
從某種程度上講,深度強化學習是一種經(jīng)過增強的記憶系統(tǒng);它在某些場景中確實擁有良好表現(xiàn),但對工作內(nèi)容的理解程度卻非常有限。因此,這類系統(tǒng)沒什么靈活性可言,無法即時根據(jù)環(huán)境變化做出調(diào)整,并最終導(dǎo)致極微小的變化都會顯著影響實際性能。(DeepMind最近公布的腎病檢查方案,也因為類似的問題而遭到質(zhì)疑。)
深度強化學習同時需要大量數(shù)據(jù)作為支持——例如在學習圍棋時,需要完成數(shù)百萬盤自我對局才能掌握個人奧妙。很明顯,人類棋手不需要也不可能完成如此龐大的訓練量,而且這樣的過程難度極高且成本極巨,只有谷歌這樣的科技巨頭才能負擔得起恐怖的計算資源需求。換言之,絕大多數(shù)企業(yè)與客戶根本不可能在自己孱弱的獨立計算機上實現(xiàn)類似的現(xiàn)實問題解決能力。根據(jù)估算,AphaGo的整個訓練周期耗資達3500萬美元,其消耗的能量足以支持12760個人連續(xù)三天不停進行腦力勞動。
以上討論的只是經(jīng)濟問題。更重要的是,正如Ernest Davis和筆者在即將出版的《Robboting AI》一書中提到,我們能否信任現(xiàn)有AI方案。目前,深度強化學習只能在良好可控的環(huán)境下提供可靠的結(jié)果;這樣的局限對于圍棋這種兩千年來沒怎么發(fā)生變化的場景非常適用,但我們顯然不敢貿(mào)然把它引入到其它現(xiàn)實問題當中。
>>> 難以實現(xiàn)商業(yè)應(yīng)用
之所以難以商業(yè)應(yīng)用,主要是因為目前大多數(shù)實際問題都不像游戲那樣擁有嚴格的場景與條件。也正因為如此,DeepMind目前仍拿不出比較像樣的深度強化學習商業(yè)方案。與此同時,Alphabet已經(jīng)在DeepMind身上燒掉了約20億美元(包括2014年收購DeepMind的6.5億美元)。但除了賺到的好名聲之外,DeepMind在過去一年中只帶來了約1.25億美元的實際收入,其中相當一部分為Alphabet內(nèi)部利用深度強化學習技術(shù)降低冷卻成本省下的電費。
而且在圍棋領(lǐng)域大顯身手的技能,也很難解決其它挑戰(zhàn)性問題——例如癌癥與清潔能源。這類狀況早已有之:IBM公司的Watson曾在問答節(jié)目當中一鳴驚人,但卻一直無法成功進軍醫(yī)學診斷領(lǐng)域。雖能夠在某些病例中提供良好表現(xiàn),但Watson在另一些病例中卻慘遭失敗,甚至還曾經(jīng)在心臟病發(fā)作癥狀的判斷上犯錯——要知道,這可是醫(yī)學新生都能準確判斷的病癥。
當然,時間也許能夠解決這個難題。至少自2013年以來,DeepMind就一直在努力研究深度強化學習技術(shù),而且科技進步也向來難以快速轉(zhuǎn)化為實際產(chǎn)品。DeepMind以及其它研究機構(gòu),最終也許能夠找到一種可行的方式,促進深度強化學習帶來更穩(wěn)定也更契合任務(wù)內(nèi)容的結(jié)果;又或者,這項技術(shù)未來能夠與其它技術(shù)結(jié)合起來,迸發(fā)出新的能量。也許深度強化學習最終能夠像當年的晶體管一樣,成為一種徹底改變世界的實驗室發(fā)明,也有可能永遠停留在探索階段,僅僅作為人類不斷探索真理的道路上的又一塊鋪路石。但無論如何,筆者個人猜測最終結(jié)果可能介于這兩者之間——有用而且廣泛存在,但又不足以改變整個世界。
雖然DeepMind目前的成果沒能完全符合人們的期待,相信也不會有人對其妄加指摘。深度強化學習不一定是通往人工通用智能的正確道路,但這絲毫不妨礙DeepMind自身的偉大——這仍是一個運營嚴密、資金充裕而且人才濟濟的機構(gòu)。而且如果接下來AI的發(fā)展方向有所變化,DeepMind也一定會是能夠迅速抓住機會的參與者之一。就目前來看,能夠與DeepMind相抗衡的研究機構(gòu)仍然屈指可數(shù)。與此同時,Alphabet也是一家財力雄厚的企業(yè),對他們來說一年5億美元也不是啥大問題。Alphabet公司曾非常英明地決定投資AI技術(shù),其中包括目前同樣在快速成長的Google Brain項目。Alphabet方面可能會通過多種途徑調(diào)整自家AI方案的組合方式,不過考慮到這是一家年收入高達1000億美元的行業(yè)巨頭,而且旗下搜索服務(wù)及廣告推薦等大部分業(yè)務(wù)都依賴于AI技術(shù),相信他們有能力也有理由繼續(xù)支持這些重量級研發(fā)項目。
>>> 過度炒作難題
關(guān)于最后一個問題,我們目前還很難判斷DeepMind的經(jīng)濟狀況會給整個AI市場帶來怎樣的影響。如果交付的成果完全跟不上當初的炒作宣傳,那么“人工智能寒冬”也許終將來臨,甚至導(dǎo)致原本的支持者失去信心而停止投入。另外,如果DeepMind在未來幾年中的虧損額繼續(xù)一路飆升,恐怕Alphabet自己也有可能被迫退出。畢竟到目前為止,DeepMind還是拿不出像樣的財報數(shù)據(jù),時間久了投資者難免要重新思考自己對于AI技術(shù)抱持的立場。
同樣麻煩纏身的,遠不只是DeepMind。無論是無人駕駛汽車還是能夠順暢理解人類語言的聊天機器人,這些幾年前被炒得火熱的概念至今仍然沒有實現(xiàn)。Mark Zuckerberg在2018年4月的國會聽證會上曾保證,虛假新聞問題很快就會在AI技術(shù)面前土崩瓦解。但是情況顯然沒這么簡單,這也使得整個社會對于AI技術(shù)的看法變得愈發(fā)保守——不信承諾,信“療效”。
至少就當下看,人工通用智能還只是個目標,距離真正落地還有很長的路。雖然AI技術(shù)在廣告及語音識別等一部分領(lǐng)域取得良好進展,但必須承認,AI發(fā)展還遠稱不上成熟。但在另一方面,我們也要認可AI在大數(shù)據(jù)分析領(lǐng)域的強大能力;而且哪怕只是當前的水平,AI也已經(jīng)是一種卓越的技術(shù)工具。因此即使未來企業(yè)不再傾力投入,AI的研究與發(fā)展也絕對不會沉寂下去。
>>> 預(yù)測未來
在筆者看來,十年之后我們可能會得出結(jié)論,發(fā)現(xiàn)深度強化學習的意義其實被高估了。這也使得其它不少真正重要的研究方向遭到忽視。畢竟在強化學習領(lǐng)域投入的第一塊錢,都代表著其它研發(fā)經(jīng)費的縮減——例如對于人類認知科學的研究。當下,很多機器學習研究人員都在問,“機器如何利用大量數(shù)據(jù)優(yōu)化復(fù)雜問題?”但我們真正應(yīng)該關(guān)心的,其實是“為什么孩子們用不著那么多數(shù)據(jù)和那么復(fù)雜的處理流程,就能掌握自然語言并理解現(xiàn)實世界?”如果我們能在后一個問題上多花點時間、資金和精力,也許人工通用智能的來臨還能更早一些。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。