2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網(wǎng) 版權歸原作者所有。
除了追求人工智能的實際應用之外,英特爾公司還投資研究以發(fā)展該技術的理論基礎。芯片制造商工作的最新成果是可以加速復雜AI模型開發(fā)的算法。
協(xié)同進化強化學習或CERL算法今天在加利福尼亞州的ICML機器學習會議上提出。它有望加快AI項目的培訓階段,這是開發(fā)周期中最耗時的部分之一。
工程師通過讓他們在模擬設置中反復執(zhí)行給定的任務來提高模型的準確性。該過程通常涉及虛擬獎勵的使用:當AI做正確的事情(例如,正確識別照片中的動物)時,它會得到一個積分,并將經(jīng)驗中的教訓應用到未來的圖像中。這是一種強大的方法,但是英特爾在描述CERL的學術論文中強調說,該方法有一定的局限性。
通過基于獎勵的培訓來授課的神經(jīng)網(wǎng)絡通常會采取“安全路線”,以最大限度地提高其獲得的積分數(shù)量。然后,AI承擔風險并嘗試新方法的可能性就降低了。這最終限制了模型在訓練期間學到的東西,這意味著一旦將模型部署到應用程序中,模型的運行效率可能會降低。
所謂的基于策略梯度的機器學習方法尤為突出,這是工程師訓練AI模型的最常見方式之一。有一種沒有這種限制的替代方法-進化強化學習-但它有其自身的權衡:它需要更多的硬件。英特爾的CERL算法旨在通過將兩種方法的關鍵概念組合到混合工作流程中來提供解決方案。
CERL通過生成一組具有隨機設置的神經(jīng)網(wǎng)絡來啟動培訓課程。該算法挑選出在學習中獲得最多積分的模型,將其余的丟棄,并根據(jù)性能最高的模型生成新一批的AI。這就產生了一種情況,其中新一代的神經(jīng)網(wǎng)絡都比其前輩更好。
英特爾AI實驗室的工程研究負責人Somdeb Majumdar解釋說:“保留了排名最高的'精英',其余的則被丟棄。” “我們還對精英分子進行突變(以小擾動克隆)……以產生高性能的后代,以回填被丟棄的網(wǎng)絡。”
為了加快培訓速度,英特爾研究人員為CERL配備了一種稱為重播緩沖區(qū)的機制。這是一個交流渠道,可以使每一代的神經(jīng)網(wǎng)絡彼此共享經(jīng)驗,以更快地學習。同時,第二種機制優(yōu)化了硬件分配,從而為最快學習的模型提供了更多的計算能力,從而進一步加快了速度。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網(wǎng) 版權歸原作者所有。