您的位置: 首頁 >互聯(lián)網(wǎng) >

ShareBackup可以將數(shù)據(jù)保存在快車道上

2019-06-12 16:46:18 編輯: 來源:
導讀 任何一個曾經(jīng)詛咒過計算機網(wǎng)絡的人都會因為它慢慢爬行而感到高興,他們會欣賞萊斯大學科學家提供的補救措施。賴斯計算機科學家Eugene Ng及

任何一個曾經(jīng)詛咒過計算機網(wǎng)絡的人都會因為它慢慢爬行而感到高興,他們會欣賞萊斯大學科學家提供的補救措施。

賴斯計算機科學家Eugene Ng及其團隊表示,當故障不可避免地發(fā)生時,他們的解決方案將使數(shù)據(jù)保持在快速通道上。

Ng推出了ShareBackup,這種策略允許數(shù)據(jù)中心的共享備份交換機在軟件或硬件交換機 故障后的幾分之一秒內(nèi)接收網(wǎng)絡流量。

他將于本周在匈牙利布達佩斯召開的SIGCOMM 2018年會議上發(fā)表關于這項工作的同行評審文章。該論文在線并可供下載。

Ng表示,這個想法將解決數(shù)據(jù)專業(yè)人士,科學家以及依賴網(wǎng)絡日復一日地提供結果的所有人之間的共同煩惱。

“數(shù)據(jù)網(wǎng)絡由服務器和網(wǎng)絡交換機組成,”計算機科學與電氣和計算機工程教授Ng說。“交換機將數(shù)據(jù)包移動到他們需要去的地方。但事情就會失敗,特別是在擁有數(shù)千塊硬件的大型數(shù)據(jù)中心。”

對故障開關的通常響應是將數(shù)據(jù)流分流到另一條線路。“一般來說,網(wǎng)絡有多條連接服務器的路徑,就像高速公路上有一個關閉一樣,我們會繞過它。這是一種傳統(tǒng)的,自然的方法很有意義:你繞過失敗的路線到達你需要去的地方。“

但有時候其他道路擁擠,一切都變慢了。“數(shù)據(jù)中心不是互聯(lián)網(wǎng);它們不是人們?yōu)g覽網(wǎng)站,”Ng說。“它們是支持數(shù)據(jù)密集型應用程序,如數(shù)據(jù)挖掘或機器學習。而且很多這些應用程序都有嚴格的性能截止日期,因此盲目地重新路由流量可能是數(shù)據(jù)中心的錯誤做法。”

Ng實驗室的策略不是在整個網(wǎng)絡中安裝冗余交換機的昂貴選擇,而是將快速交換機和軟件置于戰(zhàn)略位置,以便在一微秒內(nèi)從故障交換機中獲取流量。解決該問題后,該團隊的軟件可以使備份交換機可用于處理其他故障。

交換機足夠快 - 故障恢復時間為0.73毫秒,包括來自硬件和控制系統(tǒng)的延遲 - 大多數(shù)用戶永遠不會知道系統(tǒng)的一部分發(fā)生故障。

“現(xiàn)實情況是,在任何給定時間內(nèi)發(fā)生故障的設備的比例非常小,而且大多數(shù)故障都可以通過重啟設備來解決,”Ng說。“有時候軟件搞砸了,一個簡單的電源循環(huán)就會把它帶回來。這些故障可能也不會持久。

“這些是我們試圖利用的特征,”他說。“正因為如此,我們可以通過很少的設備來備份大量設備。”

Ng表示,ShareBackup可以節(jié)省數(shù)據(jù)中心的時間和金錢,不僅可以保持全部帶寬,還可以幫助分析問題,包括通常導致網(wǎng)絡故障的錯誤配置。

“我們的部分工作是幫助數(shù)據(jù)中心找出網(wǎng)絡出了什么問題,”他說。“激活備份后,您可以將故障設備從生產(chǎn)網(wǎng)絡中取出并進行測試,以確定導致問題的組件。

“現(xiàn)在,如果我們拿出兩個設備,無法弄清哪個設備壞了,兩個都需要更換,”他說。“很可能只有一個設備出現(xiàn)問題。我們的軟件可以半自動方式診斷這些設備,如果其中一個部件是好的,它可以恢復。”


免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網(wǎng) 版權歸原作者所有。