您的位置: 首頁 >科技 >

學習數(shù)據(jù)科學的12個關鍵技巧

2022-08-26 11:11:50 編輯:單建舒 來源:
導讀 數(shù)據(jù)科學家在Glassdoor上被評為2019年最佳職位?;竟べY中位數(shù)為108,000美元,工作滿意度排名為4.3,滿分為5,加上預計的開放數(shù)量,這并不...

數(shù)據(jù)科學家在Glassdoor上被評為2019年最佳職位?;竟べY中位數(shù)為108,000美元,工作滿意度排名為4.3,滿分為5,加上預計的開放數(shù)量,這并不奇怪。問題是:為了順利完成這項工作,我們必須做些什么?

為了找到答案,我們尋找那些尋求進入這個職業(yè)軌道的人的建議。很大程度上歸結(jié)于編碼和數(shù)學方面的硬技能。但僅憑強大的計算并沒有削減它。成功的數(shù)據(jù)科學家還需要能夠以自己的方式與商業(yè)人士交流,這需要與軟技能和領導力相關的能力。

建立教育基金會:三個主要技巧

紐約數(shù)據(jù)科學學院的數(shù)據(jù)科學家Drace Zhan 強調(diào)需要一個教育基礎,其中包括編碼和數(shù)學能力的基本要素:

R / Python + SQL。如果你沒有編碼技能,你需要很多網(wǎng)絡能力和其他方面來加強這種不足。我見過的數(shù)據(jù)科學家數(shù)學能力差,領域經(jīng)驗不多,但他們總是有很強的編碼能力。Python是理想的,但R是一個很棒的后備工具。最好同時擁有你的武器庫。SQL對于Data Analyst來說也非常重要。

強大的數(shù)學技能。對一些常用方法有很好的理解:廣義線性模型,決策樹,K均值和統(tǒng)計檢驗優(yōu)于具有各種模型或?qū)I(yè)化(如RNN)的廣泛圖景。

一些專家補充說,這些是建立在上面的核心技能。例如,KDnuggets列表包含Zhan提到的編碼組件,并在技術方面添加了一些其他有用的東西,包括Hadoop平臺Apache Spark,數(shù)據(jù)可視化,非結(jié)構化數(shù)據(jù),機器學習和AI。

但是,如果我們通過對Kaggle調(diào)查中確定用于現(xiàn)實生活的最常用工具的調(diào)查得出我們的線索,我們會得到一些不同的結(jié)果。從下面的前15個選項圖中可以看出,Python,R和SQL很容易進入前三,但第四個是Jupyter筆記本,其次是TensorFlow,Amazon Web Services,Unix shell,Tableau,C / C ++,NoSQL,MATLAB / Octave和Java,都領先于Hadoop和Spark。微軟的Excel數(shù)據(jù)挖掘是另一個令人驚訝的新增功能。

該KDnuggets名單中還包括關于正規(guī)教育小費。大多數(shù)數(shù)據(jù)科學家擁有高級學位:46%擁有博士學位,88%至少擁有碩士學位。他們擁有的本科學位一般分為相關領域。大約三分之一是數(shù)學和統(tǒng)計學,這是這個職業(yè)軌道中最受歡迎的。其次是最受歡迎的是計算機科學學位,占19%,工程學占16%。當然,數(shù)學科學專用的技術工具通常不會在學位課程中學習,而是在專業(yè)訓練營或在線課程中學習。

不僅僅是課程:還有兩個提示

Hank Yun是威爾康奈爾醫(yī)學院肺科系的研究助理,也是紐約數(shù)據(jù)科學學院的學生,他建議有抱負的數(shù)據(jù)科學家計劃他們將要做的工作并尋找導師。他說:

不要因為你參加課程并獲得證書而告訴自己你知道數(shù)據(jù)科學,從而犯了我的錯誤。這是一個很好的開始,但是當你開始學習時,請記住一個項目。然后找到該領域的導師,立即開始一個激情項目!當你新鮮的時候,你不知道你不知道什么,所以當有人在那里指導你對你重要的事情和什么不重要時,它會有所幫助。你不想花很多時間學習沒有任何東西可以展示它!

知道從工具箱中取出哪種工具:提示保持曲線前進

鑒于數(shù)據(jù)科學工具排名的差異,有些人可能會對應該關注什么感到困惑。安全軟件公司邁克菲首席數(shù)據(jù)科學家Celeste Fralick在一篇CIO文章中解決了這個問題,該文章著眼于數(shù)據(jù)科學家的基本技能,宣稱“數(shù)據(jù)科學家需要在研究中保持領先地位,以及了解什么技術適用時。“這意味著沒有被”性感“和新的誘惑,當實際問題”需要更多的普通問題。“意識到生態(tài)系統(tǒng)的計算成本,可解釋性,延遲,帶寬,以及其他系統(tǒng)邊界條件 - 以及客戶的成熟度 - 本身有助于數(shù)據(jù)科學家了解應用哪種技術。“

基本軟技能:另外六個技巧

Fralick提出的觀點與數(shù)據(jù)科學家工作所需的非技術技能有關。這就是為什么KDnuggets列表包括以下四個:求知欲,團隊合作,溝通技巧和商業(yè)頭腦。Zhan還在數(shù)據(jù)科學家的技巧中包含了關鍵的軟技能,識別了像KDnuggets這樣的“溝通技巧”,但是使用“領域?qū)I(yè)知識”代替了“商業(yè)敏銳”。無論它被稱為什么,它都指的是數(shù)據(jù)科學的實際應用。商業(yè)。(要了解有關溝通技巧的更多信息,請參閱技術專業(yè)人員溝通技巧的重要性。)

奧利維亞·帕爾魯?shù)?Olivia Parr-Rud)對此提出了自己的想法,增加了兩種軟技能,強調(diào)了創(chuàng)造力的作用,斷言“我認為數(shù)據(jù)科學既像藝術又像科學一樣”,需要借鑒大腦兩側(cè)的優(yōu)勢。“很多人都把數(shù)據(jù)科學稱為主要使用左腦的職業(yè)。我發(fā)現(xiàn)要成功,數(shù)據(jù)科學家必須使用他們的整個大腦。“

她解釋說,在該領域取得進步不僅需要技術能力,還需要創(chuàng)造力和領導力所需的愿景:

大多數(shù)左腦/線性任務可以自動化或外包。為了提供數(shù)據(jù)科學家的競爭優(yōu)勢,我們必須能夠識別模式并使用我們大腦的兩側(cè)來合成大量信息。我們必須是創(chuàng)新思想家。許多最好的結(jié)果來自左腦和右腦的整合。

她還強調(diào)為什么清楚地傳達愿景是至關重要的:

作為數(shù)據(jù)科學家,我們的目標是利用數(shù)據(jù)幫助客戶增加利潤。大多數(shù)高管不了解我們做什么或我們?nèi)绾巫觥K晕覀冃枰耦I導者一樣思考并用我們的利益相關者理解和信任的語言來傳達我們的發(fā)現(xiàn)和建議。

關鍵技巧包含了大量的技術工具,技能和能力,以及不太可量化的品質(zhì),如創(chuàng)造力和領導能力。最終,它不僅僅是一場數(shù)字游戲。由于數(shù)據(jù)科學不僅僅是在真空中創(chuàng)建模型,而是提出實際應用來解決企業(yè)的現(xiàn)實生活問題,那些在該領域取得成功的人不僅要掌握技術,還要了解他們的業(yè)務領域并了解他們的需求。工作團隊的各個成員。


免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!

猜你喜歡

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權歸原作者所有。