2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
DataRobot是自動(dòng)化機(jī)器學(xué)習(xí)(ML)和人工智能(AI)領(lǐng)域的領(lǐng)軍企業(yè),它收購(gòu)了Paxata, Paxata是早期的自助數(shù)據(jù)準(zhǔn)備純粹的游戲供應(yīng)商之一。DataRobot表示,收購(gòu)Paxata將有助于“增強(qiáng)其端到端的人工智能能力”;事實(shí)上,它在這一主題的新聞稿中也使用了同樣的措辭。交易條款沒(méi)有披露。
Paxata,就其本身而言,可能更關(guān)注于直接的描述性分析的數(shù)據(jù)準(zhǔn)備,而不是人工智能。但人工智能平臺(tái)也需要準(zhǔn)備數(shù)據(jù),以幫助數(shù)據(jù)科學(xué)家精簡(jiǎn)和凈化他們的數(shù)據(jù)集。數(shù)據(jù)準(zhǔn)備在所謂的特征工程工作中也非常有用,它的目的是在數(shù)據(jù)準(zhǔn)備工作發(fā)生之前,從列數(shù)據(jù)的特定子集中提取ML模型輸入(“特征”)到它們自己的數(shù)據(jù)列中。
我與菲爾?Gurbacki DataRobot高級(jí)產(chǎn)品開(kāi)發(fā)和客戶(hù)體驗(yàn),他告訴我每個(gè)DataRobot用戶(hù)需要做數(shù)據(jù)準(zhǔn)備為了成功毫升。這樣,Gurbacki表示,盡管獨(dú)立Paxata產(chǎn)品仍將是可用的,該公司是最熱衷于拍攝Paxata數(shù)據(jù)準(zhǔn)備,把每一個(gè)DataRobot客戶(hù)一體化的方式。
Gurbacki還解釋說(shuō),用于A(yíng)I和ML的數(shù)據(jù)準(zhǔn)備工作負(fù)載與用于BI和分析的不同。首先,人工智能的準(zhǔn)備工作通常集中在一組被轉(zhuǎn)換為模型特性的列上。此外,不僅需要準(zhǔn)備數(shù)據(jù)來(lái)訓(xùn)練ML模型,還需要準(zhǔn)備這些模型在生成預(yù)測(cè)時(shí)得到的數(shù)據(jù)。數(shù)據(jù)需要以非常低的延遲發(fā)生,并且本質(zhì)上是一個(gè)頻繁的生產(chǎn)過(guò)程。這與BI數(shù)據(jù)準(zhǔn)備不同,后者在較大的數(shù)據(jù)卷上針對(duì)一組廣泛的列執(zhí)行的頻率較低。
盡管工作負(fù)載不同,但DataRobot認(rèn)為Paxata技術(shù)已經(jīng)準(zhǔn)備好并能夠適應(yīng)這兩種場(chǎng)景。
Paxata于2012年由一個(gè)團(tuán)隊(duì)創(chuàng)建,其中包括來(lái)自企業(yè)商業(yè)智能(BI)領(lǐng)域的經(jīng)驗(yàn)豐富的老手。創(chuàng)始人之一,首席產(chǎn)品官Nenshad Bardoliwalla是遺留CRM供應(yīng)商Siebel的分析團(tuán)隊(duì)的校友,以及BI先鋒Hyperion和SAP(Siebel和Hyperion都被Oracle收購(gòu)了)。聯(lián)合創(chuàng)始人兼首席執(zhí)行官普拉卡什?南杜里來(lái)自Tibco和SAP。
我在紐約的aTDWIchapter會(huì)議上遇到了Bardoliwalla,當(dāng)時(shí)Paxata還處于隱身模式。他解釋說(shuō),他和其他人都堅(jiān)信,在企業(yè)級(jí)BI世界中,準(zhǔn)備數(shù)據(jù)太困難,太依賴(lài)IT專(zhuān)家。這種情況反過(guò)來(lái)又剝奪了企業(yè)用戶(hù)以熱情和效率追求分析的權(quán)利。
如果這是一個(gè)標(biāo)準(zhǔn)化測(cè)試中的類(lèi)比問(wèn)題,我們可能會(huì)說(shuō)[Paxata]:[data prep]和[DataRobot]:[AI和ML]。這兩家公司都試圖通過(guò)提供自助服務(wù)平臺(tái)來(lái)實(shí)現(xiàn)各自技術(shù)領(lǐng)域的民主化,從而增強(qiáng)業(yè)務(wù)用戶(hù)的能力,減輕他們對(duì)專(zhuān)業(yè)人士的依賴(lài)??紤]到這一點(diǎn),這次收購(gòu)意義重大。Gurbacki告訴我“DataRobot的使命是建立一個(gè)企業(yè)AI平臺(tái),在原始數(shù)據(jù)和商業(yè)價(jià)值之間架起一座橋梁。”
另外,通過(guò)多樣化和現(xiàn)在的整合,作為純游戲供應(yīng)商類(lèi)別的data prep也在減少。Alteryx通過(guò)收購(gòu)Semanta和Yhat,在數(shù)據(jù)目錄和人工智能領(lǐng)域顯著拓寬了其平臺(tái)。Datameer也推出了自己的Neebo數(shù)據(jù)虛擬化平臺(tái)。在Trifacta保持獨(dú)立的同時(shí),該公司高度關(guān)注云數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖場(chǎng)景,谷歌利用了該公司的技術(shù)開(kāi)發(fā)其云Dataprep產(chǎn)品。與此同時(shí),微軟(Microsoft)、Informatica、Talend和Tableau等公司已將自行開(kāi)發(fā)的自助數(shù)據(jù)準(zhǔn)備系統(tǒng)添加到它們自己的堆棧和核心產(chǎn)品中。
亦讀:Alteryx擴(kuò)展產(chǎn)品集,做數(shù)據(jù)科學(xué)采集
對(duì)于特定技術(shù)領(lǐng)域的創(chuàng)新(比如為大數(shù)據(jù)做自助數(shù)據(jù)準(zhǔn)備)來(lái)說(shuō),這是一個(gè)自然的流程,會(huì)產(chǎn)生多個(gè)純粹的供應(yīng)商,他們會(huì)將創(chuàng)新產(chǎn)品化。這是一個(gè)自然的結(jié)果,隨著一個(gè)創(chuàng)新領(lǐng)域的成熟,它的供應(yīng)商會(huì)被現(xiàn)有的和新領(lǐng)域的參與者收購(gòu),比如人工智能。我們已經(jīng)看到這種情況發(fā)生在商業(yè)智能上——雖然一個(gè)數(shù)據(jù)點(diǎn)不構(gòu)成趨勢(shì)——也許現(xiàn)在我們會(huì)在數(shù)據(jù)準(zhǔn)備上看到它。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。