您的位置: 首頁 >互聯(lián)網(wǎng) >

如何處理數(shù)據(jù)發(fā)現(xiàn)

2020-06-19 15:02:27 編輯: 來源:
導(dǎo)讀 就其本質(zhì)而言,數(shù)據(jù)發(fā)現(xiàn)是冗長、麻煩和令人困惑的。隨著數(shù)據(jù)從四面八方涌入,業(yè)務(wù)目標(biāo)不斷被調(diào)整,員工不知道從哪里開始,評(píng)估數(shù)據(jù)和各種數(shù)據(jù)組合的價(jià)值,然后試圖從數(shù)據(jù)中提取洞察力可能是一項(xiàng)艱巨的任務(wù)。 業(yè)務(wù)分析提供商Microstrategy將數(shù)據(jù)發(fā)現(xiàn)定義為:“收集和分析來自各種來源的數(shù)據(jù),以洞察隱藏的模式和趨勢(shì)。”通過數(shù)據(jù)發(fā)現(xiàn)過程,按照一系列步驟收集、組合和分析數(shù)據(jù)。我們的目標(biāo)是讓雜亂分散的數(shù)據(jù)變得

就其本質(zhì)而言,數(shù)據(jù)發(fā)現(xiàn)是冗長、麻煩和令人困惑的。隨著數(shù)據(jù)從四面八方涌入,業(yè)務(wù)目標(biāo)不斷被調(diào)整,員工不知道從哪里開始,評(píng)估數(shù)據(jù)和各種數(shù)據(jù)組合的價(jià)值,然后試圖從數(shù)據(jù)中提取洞察力可能是一項(xiàng)艱巨的任務(wù)。

 

 

業(yè)務(wù)分析提供商Microstrategy將數(shù)據(jù)發(fā)現(xiàn)定義為:“收集和分析來自各種來源的數(shù)據(jù),以洞察隱藏的模式和趨勢(shì)。”通過數(shù)據(jù)發(fā)現(xiàn)過程,按照一系列步驟收集、組合和分析數(shù)據(jù)。我們的目標(biāo)是讓雜亂分散的數(shù)據(jù)變得干凈、易懂、用戶友好。”

為了從所有類型的數(shù)據(jù)中最大化價(jià)值,組織必須進(jìn)行數(shù)據(jù)發(fā)現(xiàn)。

以下是組織可以采取的一些步驟,使數(shù)據(jù)發(fā)現(xiàn)更容易,對(duì)公司更有價(jià)值。

數(shù)據(jù)就像金或銀一樣,是嵌在泥土和巖石里的。你必須刪除不相關(guān)的內(nèi)容,以獲得相關(guān)的內(nèi)容。除非您知道您的公司使用的是干凈準(zhǔn)確的數(shù)據(jù),否則您無法保證數(shù)據(jù)的業(yè)務(wù)價(jià)值。

在數(shù)據(jù)進(jìn)入公司的每一點(diǎn)上都應(yīng)該有標(biāo)準(zhǔn)流程,以確保數(shù)據(jù)來自經(jīng)過審查的來源,并且符合公司治理標(biāo)準(zhǔn)。必須識(shí)別和消除錯(cuò)誤和重復(fù)的數(shù)據(jù)。在其他情況下,必須規(guī)范化數(shù)據(jù),以便將引用同一數(shù)據(jù)項(xiàng)的不同數(shù)據(jù)名稱標(biāo)準(zhǔn)化為單個(gè)數(shù)據(jù)名稱。如果使用第三方數(shù)據(jù)源獲取數(shù)據(jù),也應(yīng)該審查其數(shù)據(jù)清理技術(shù)。

幸運(yùn)的是,可以使用數(shù)據(jù)清理工具和自動(dòng)化來執(zhí)行許多這些數(shù)據(jù)清理任務(wù)。通常很難證明投資于這些工具的投資回報(bào)率,但是就像公司安全一樣,它們是一項(xiàng)必要的投資,可以防止從糟糕的數(shù)據(jù)得出錯(cuò)誤的業(yè)務(wù)決策。

就像昨天的新聞一樣,數(shù)據(jù)的時(shí)代很快。操作流程應(yīng)該定期刷新數(shù)據(jù),無論這些間隔是實(shí)時(shí)的、每天的、每周的還是每月的。業(yè)務(wù)單位的數(shù)據(jù)相關(guān)性需求變化非???,以至于今天有用的數(shù)據(jù)可能在6個(gè)月后就不再有用了。為了避免存儲(chǔ)和繼續(xù)處理不再相關(guān)的數(shù)據(jù),IT部門應(yīng)該至少每年與業(yè)務(wù)單位會(huì)面,以確定哪些數(shù)據(jù)仍然相關(guān),哪些數(shù)據(jù)不再需要保留。這有助于降低存儲(chǔ)的數(shù)據(jù)量以及存儲(chǔ)成本。

有一個(gè)機(jī)器學(xué)習(xí),人工智能數(shù)據(jù)處理的一個(gè)子集,隱藏模式human-developed算法的數(shù)據(jù)或觀察可能小姐,這使得你的數(shù)據(jù)發(fā)現(xiàn)過程更加強(qiáng)大的,因?yàn)樗鼣U(kuò)大領(lǐng)域的數(shù)據(jù)你想找到的見解。

有大量以照片、視頻和紙質(zhì)文檔的形式存在的、暗藏的、非結(jié)構(gòu)化的數(shù)據(jù)被儲(chǔ)存在公司的儲(chǔ)藏室和壁櫥里。作為數(shù)字化努力的一部分,公司應(yīng)該審查這些暗數(shù)據(jù),并決定哪些應(yīng)該數(shù)字化并鏈接到數(shù)據(jù)存儲(chǔ)庫中,哪些應(yīng)該丟棄。

 


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。