人工智能的兩個(gè)基本要素是訓(xùn)練和推理

2022-07-18 04:21:21 編輯：祝秋松來(lái)源：

導(dǎo)讀許多人已經(jīng)觀察到，我們正處于下一次工業(yè)革命的曙光：人工智能(AI)革命。這場(chǎng)智能革命帶來(lái)的好處將是很多的：在醫(yī)學(xué)，改進(jìn)的診斷和精確...

許多人已經(jīng)觀察到，我們正處于下一次工業(yè)革命的曙光：人工智能(AI)革命。這場(chǎng)智能革命帶來(lái)的好處將是很多的：在醫(yī)學(xué)，改進(jìn)的診斷和精確治療，更好的天氣預(yù)報(bào)以及自動(dòng)駕駛汽車(chē)等方面。但是，這場(chǎng)革命的成本之一將是為它供電的數(shù)據(jù)中心增加電力消耗。數(shù)據(jù)中心的電力使用量預(yù)計(jì)將在未來(lái)10年內(nèi)翻一番，并有望在2030年之前消耗全球11%的電力。除了采用AI外，這一趨勢(shì)的其他驅(qū)動(dòng)因素還包括向云的遷移以及CPU，GPU的電力使用量的增加。和其他服務(wù)器組件，它們變得越來(lái)越強(qiáng)大和智能。

人工智能的兩個(gè)基本要素，即訓(xùn)練和推理，各自消耗的能量不同。訓(xùn)練涉及對(duì)非常大的數(shù)據(jù)集進(jìn)行計(jì)算密集型矩陣運(yùn)算，這些數(shù)據(jù)集通常以TB到PB為單位。這些數(shù)據(jù)集的示例范圍從在線銷(xiāo)售數(shù)據(jù)到捕獲的視頻提要，再到腫瘤的超高分辨率圖像。從本質(zhì)上講，AI推理在計(jì)算上要輕得多，但是可以無(wú)限期地作為服務(wù)運(yùn)行，當(dāng)遇到大量請(qǐng)求時(shí)，它會(huì)消耗大量能量?？紤]一下用于辦公樓安全性的面部識(shí)別應(yīng)用程序。它會(huì)連續(xù)運(yùn)行，但會(huì)在人們上班和上班時(shí)在8:00 am和5:00 pm再次占用計(jì)算和存儲(chǔ)資源。

但是，很難掌握AI中的功耗。能耗不是作業(yè)計(jì)劃程序跟蹤的標(biāo)準(zhǔn)指標(biāo)的一部分，雖然可以設(shè)置，但它很復(fù)雜且依賴(lài)于供應(yīng)商。這意味著，大多數(shù)用戶(hù)在能源使用方面都是“盲目”。

為了制定AI能源需求，Miro Hodak博士領(lǐng)導(dǎo)了一個(gè)由Lenovo工程師和研究人員組成的團(tuán)隊(duì)，研究了經(jīng)常使用的AI工作負(fù)載的能源成本。數(shù)據(jù)中心硬件深度學(xué)習(xí)中的功率效率研究，(需要注冊(cè))最近在2019 IEEE國(guó)際大數(shù)據(jù)會(huì)議上發(fā)表，并在會(huì)議記錄中發(fā)表。這項(xiàng)工作著眼于在配備4個(gè)Nvidia V100 GPU的Lenovo ThinkSystem SR670服務(wù)器上使用ImageNet數(shù)據(jù)集(包含130萬(wàn)張圖像)訓(xùn)練ResNet50神經(jīng)網(wǎng)絡(luò)的能源成本。服務(wù)器電源的AC數(shù)據(jù)表明，完全訓(xùn)練此AI模型需要6.3 kWh的能量，足以為一個(gè)普通家庭供電6個(gè)小時(shí)。在實(shí)踐中，類(lèi)似的訓(xùn)練會(huì)重復(fù)多次以調(diào)整生成的模型，從而導(dǎo)致能源成本實(shí)際上高出幾倍。

該研究將總能量分解成其各個(gè)分量，如圖1所示。正如預(yù)期的那樣，GPU消耗了大部分能量。但是，考慮到GPU可以處理所有計(jì)算密集型部分，因此65%的能量份額低于預(yù)期。這表明僅使用GPU功率對(duì)AI能源成本的簡(jiǎn)單估算是不準(zhǔn)確的，并且錯(cuò)過(guò)了系統(tǒng)其余部分的重大貢獻(xiàn)。除GPU外，CPU和內(nèi)存占能源使用量的近四分之一，而9%的能量用于交流到直流電源轉(zhuǎn)換(這在SR670 PSU的80 PLUS白金認(rèn)證范圍內(nèi))。

標(biāo)簽：

免責(zé)聲明：本文由用戶(hù)上傳，如有侵權(quán)請(qǐng)聯(lián)系刪除！