您的位置: 首頁 >科技 >

學習數(shù)據(jù)科學的12個關(guān)鍵技巧

2022-08-26 11:11:50 編輯:單建舒 來源:
導讀 數(shù)據(jù)科學家在Glassdoor上被評為2019年最佳職位?;竟べY中位數(shù)為108,000美元,工作滿意度排名為4.3,滿分為5,加上預計的開放數(shù)量,這并不...

數(shù)據(jù)科學家在Glassdoor上被評為2019年最佳職位?;竟べY中位數(shù)為108,000美元,工作滿意度排名為4.3,滿分為5,加上預計的開放數(shù)量,這并不奇怪。問題是:為了順利完成這項工作,我們必須做些什么?

為了找到答案,我們尋找那些尋求進入這個職業(yè)軌道的人的建議。很大程度上歸結(jié)于編碼和數(shù)學方面的硬技能。但僅憑強大的計算并沒有削減它。成功的數(shù)據(jù)科學家還需要能夠以自己的方式與商業(yè)人士交流,這需要與軟技能和領(lǐng)導力相關(guān)的能力。

建立教育基金會:三個主要技巧

紐約數(shù)據(jù)科學學院的數(shù)據(jù)科學家Drace Zhan 強調(diào)需要一個教育基礎(chǔ),其中包括編碼和數(shù)學能力的基本要素:

R / Python + SQL。如果你沒有編碼技能,你需要很多網(wǎng)絡(luò)能力和其他方面來加強這種不足。我見過的數(shù)據(jù)科學家數(shù)學能力差,領(lǐng)域經(jīng)驗不多,但他們總是有很強的編碼能力。Python是理想的,但R是一個很棒的后備工具。最好同時擁有你的武器庫。SQL對于Data Analyst來說也非常重要。

強大的數(shù)學技能。對一些常用方法有很好的理解:廣義線性模型,決策樹,K均值和統(tǒng)計檢驗優(yōu)于具有各種模型或?qū)I(yè)化(如RNN)的廣泛圖景。

一些專家補充說,這些是建立在上面的核心技能。例如,KDnuggets列表包含Zhan提到的編碼組件,并在技術(shù)方面添加了一些其他有用的東西,包括Hadoop平臺Apache Spark,數(shù)據(jù)可視化,非結(jié)構(gòu)化數(shù)據(jù),機器學習和AI。

但是,如果我們通過對Kaggle調(diào)查中確定用于現(xiàn)實生活的最常用工具的調(diào)查得出我們的線索,我們會得到一些不同的結(jié)果。從下面的前15個選項圖中可以看出,Python,R和SQL很容易進入前三,但第四個是Jupyter筆記本,其次是TensorFlow,Amazon Web Services,Unix shell,Tableau,C / C ++,NoSQL,MATLAB / Octave和Java,都領(lǐng)先于Hadoop和Spark。微軟的Excel數(shù)據(jù)挖掘是另一個令人驚訝的新增功能。

該KDnuggets名單中還包括關(guān)于正規(guī)教育小費。大多數(shù)數(shù)據(jù)科學家擁有高級學位:46%擁有博士學位,88%至少擁有碩士學位。他們擁有的本科學位一般分為相關(guān)領(lǐng)域。大約三分之一是數(shù)學和統(tǒng)計學,這是這個職業(yè)軌道中最受歡迎的。其次是最受歡迎的是計算機科學學位,占19%,工程學占16%。當然,數(shù)學科學專用的技術(shù)工具通常不會在學位課程中學習,而是在專業(yè)訓練營或在線課程中學習。

不僅僅是課程:還有兩個提示

Hank Yun是威爾康奈爾醫(yī)學院肺科系的研究助理,也是紐約數(shù)據(jù)科學學院的學生,他建議有抱負的數(shù)據(jù)科學家計劃他們將要做的工作并尋找導師。他說:

不要因為你參加課程并獲得證書而告訴自己你知道數(shù)據(jù)科學,從而犯了我的錯誤。這是一個很好的開始,但是當你開始學習時,請記住一個項目。然后找到該領(lǐng)域的導師,立即開始一個激情項目!當你新鮮的時候,你不知道你不知道什么,所以當有人在那里指導你對你重要的事情和什么不重要時,它會有所幫助。你不想花很多時間學習沒有任何東西可以展示它!

知道從工具箱中取出哪種工具:提示保持曲線前進

鑒于數(shù)據(jù)科學工具排名的差異,有些人可能會對應(yīng)該關(guān)注什么感到困惑。安全軟件公司邁克菲首席數(shù)據(jù)科學家Celeste Fralick在一篇CIO文章中解決了這個問題,該文章著眼于數(shù)據(jù)科學家的基本技能,宣稱“數(shù)據(jù)科學家需要在研究中保持領(lǐng)先地位,以及了解什么技術(shù)適用時。“這意味著沒有被”性感“和新的誘惑,當實際問題”需要更多的普通問題。“意識到生態(tài)系統(tǒng)的計算成本,可解釋性,延遲,帶寬,以及其他系統(tǒng)邊界條件 - 以及客戶的成熟度 - 本身有助于數(shù)據(jù)科學家了解應(yīng)用哪種技術(shù)。“

基本軟技能:另外六個技巧

Fralick提出的觀點與數(shù)據(jù)科學家工作所需的非技術(shù)技能有關(guān)。這就是為什么KDnuggets列表包括以下四個:求知欲,團隊合作,溝通技巧和商業(yè)頭腦。Zhan還在數(shù)據(jù)科學家的技巧中包含了關(guān)鍵的軟技能,識別了像KDnuggets這樣的“溝通技巧”,但是使用“領(lǐng)域?qū)I(yè)知識”代替了“商業(yè)敏銳”。無論它被稱為什么,它都指的是數(shù)據(jù)科學的實際應(yīng)用。商業(yè)。(要了解有關(guān)溝通技巧的更多信息,請參閱技術(shù)專業(yè)人員溝通技巧的重要性。)

奧利維亞·帕爾魯?shù)?Olivia Parr-Rud)對此提出了自己的想法,增加了兩種軟技能,強調(diào)了創(chuàng)造力的作用,斷言“我認為數(shù)據(jù)科學既像藝術(shù)又像科學一樣”,需要借鑒大腦兩側(cè)的優(yōu)勢。“很多人都把數(shù)據(jù)科學稱為主要使用左腦的職業(yè)。我發(fā)現(xiàn)要成功,數(shù)據(jù)科學家必須使用他們的整個大腦。“

她解釋說,在該領(lǐng)域取得進步不僅需要技術(shù)能力,還需要創(chuàng)造力和領(lǐng)導力所需的愿景:

大多數(shù)左腦/線性任務(wù)可以自動化或外包。為了提供數(shù)據(jù)科學家的競爭優(yōu)勢,我們必須能夠識別模式并使用我們大腦的兩側(cè)來合成大量信息。我們必須是創(chuàng)新思想家。許多最好的結(jié)果來自左腦和右腦的整合。

她還強調(diào)為什么清楚地傳達愿景是至關(guān)重要的:

作為數(shù)據(jù)科學家,我們的目標是利用數(shù)據(jù)幫助客戶增加利潤。大多數(shù)高管不了解我們做什么或我們?nèi)绾巫?。所以我們需要像領(lǐng)導者一樣思考并用我們的利益相關(guān)者理解和信任的語言來傳達我們的發(fā)現(xiàn)和建議。

關(guān)鍵技巧包含了大量的技術(shù)工具,技能和能力,以及不太可量化的品質(zhì),如創(chuàng)造力和領(lǐng)導能力。最終,它不僅僅是一場數(shù)字游戲。由于數(shù)據(jù)科學不僅僅是在真空中創(chuàng)建模型,而是提出實際應(yīng)用來解決企業(yè)的現(xiàn)實生活問題,那些在該領(lǐng)域取得成功的人不僅要掌握技術(shù),還要了解他們的業(yè)務(wù)領(lǐng)域并了解他們的需求。工作團隊的各個成員。


免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

猜你喜歡

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。