資料科學(xué)家(Data Scientist)被譽(yù)為21世紀(jì)“最性感”的人才,。到底性感在哪里,?外界對(duì)這份職業(yè)又有哪些迷思?臺(tái)灣資料科學(xué)協(xié)會(huì)理事長(zhǎng),、中研院資訊科學(xué)所研究員陳昇瑋,,對(duì)于資料科學(xué)家的定義是“可以從數(shù)據(jù)中淘金,,用數(shù)據(jù)解決問(wèn)題的人,。
這幾年,大數(shù)據(jù),、資料科學(xué)蔚為產(chǎn)業(yè)風(fēng)潮,,但在這些名詞還未為眾人所知之前,臺(tái)灣資料科學(xué)協(xié)會(huì)理事長(zhǎng),、中研院資科所研究員陳昇瑋就已深耕于此,。陳昇瑋原先是一位工程師,、在IT業(yè)界資歷頗深,他在2000年后投身學(xué)術(shù)界,,并在三年前創(chuàng)辦一年一度的臺(tái)灣資料科學(xué)年會(huì),,積極推廣資料科學(xué)在各領(lǐng)域的應(yīng)用。
在學(xué)術(shù)界中,,陳昇瑋也是第一個(gè)在學(xué)術(shù)研究中結(jié)合真實(shí)商業(yè)數(shù)據(jù)的人,。他經(jīng)手過(guò)許多產(chǎn)業(yè)的數(shù)據(jù)研究,例如使用情緒量測(cè)技術(shù),,來(lái)預(yù)言線上游戲的成?。粚①Y料數(shù)據(jù)分析應(yīng)用在公益領(lǐng)域,,分析捐款人的偏好等,。
陳昇瑋說(shuō),目前資料科學(xué)在各行各業(yè)都已經(jīng)有很多有效的應(yīng)用,,例如美國(guó)職棒,、職籃隊(duì)伍幾乎內(nèi)部都有資料科學(xué)家,他們會(huì)根據(jù)球的位置,、球員的位置,,跳多高、跳的角度等,,來(lái)擬定有效的作戰(zhàn)策略,,或是分析球員體能表現(xiàn)等;運(yùn)用在電商領(lǐng)域可以得出哪些特質(zhì)的消費(fèi)者會(huì)喜歡什幺樣的產(chǎn)品,;透過(guò)各個(gè)城市蒐集來(lái)的空氣數(shù)據(jù)來(lái)得出污染源等等,。
從程式人跨到學(xué)術(shù)人,陳昇瑋其實(shí)最懂資料科學(xué)家所具備的“跨界”能力,。正如同他自身經(jīng)歷,,陳昇瑋認(rèn)為,資料科學(xué)家必須周游在各個(gè)產(chǎn)業(yè)領(lǐng)域之間,,絕對(duì)不像外界所想的只需要具備Programming(程式設(shè)計(jì))能力,。資料科學(xué)家的位置介于資料工程師(Data Engineer)與資料分析師(Data Analyst)中間。資料工程師需要的是電腦科學(xué)(Computer Science)專業(yè),;資料分析師需要的是統(tǒng)計(jì)(Statistical Skills)專業(yè),,資料科學(xué)家還得再加上一項(xiàng)領(lǐng)域知識(shí)(Domain Expertise)。
“資料科學(xué)沒(méi)有很神奇,,它也是一種科學(xué),。你得先觀察資料,提出你的假設(shè),然后再去驗(yàn)證結(jié)果,。”也就是說(shuō),,不管資料科學(xué)家在什幺產(chǎn)業(yè),都要先掌握那個(gè)產(chǎn)業(yè)的domain know-how(領(lǐng)域知識(shí)),,再進(jìn)一步提出假設(shè),、才能得出好的結(jié)果,“因?yàn)閱?wèn)出對(duì)的問(wèn)題,,才會(huì)得到對(duì)的答案,。”陳昇瑋說(shuō)。
不管資料科學(xué)家在什幺產(chǎn)業(yè),,都要先掌握那個(gè)產(chǎn)業(yè)的domain know-how(領(lǐng)域知識(shí)),,再進(jìn)一步提出假設(shè)、才能得出好的結(jié)果,,“因?yàn)閱?wèn)出對(duì)的問(wèn)題,,才會(huì)得到對(duì)的答案。”陳昇瑋說(shuō),。創(chuàng)意也很重要
陳昇瑋提到,,資料科學(xué)家最好要具有資訊、數(shù)學(xué)統(tǒng)計(jì),、問(wèn)題三種領(lǐng)域的專業(yè)知識(shí),,而人格特質(zhì)又以細(xì)心、溝通能力,、創(chuàng)意為三大重點(diǎn),。為什幺需要?jiǎng)?chuàng)意?因?yàn)樽鳛橐粋€(gè)資料科學(xué)家,,“創(chuàng)意”會(huì)是加乘條件,。“當(dāng)你看的東西與人不同,你想的東西也就與眾不同,。”要如何訓(xùn)練自己的創(chuàng)意,?強(qiáng)迫自己觀察,直到觀察成為生活的一部分,。
總結(jié)來(lái)說(shuō),,資料科學(xué)家其實(shí)不一定非要資訊背景出身,除了資工,、資訊,、電機(jī)等理工人外,其實(shí)統(tǒng)計(jì),、財(cái)務(wù)管理人才也很適合,,因?yàn)樗麄兙哂衅渌a(chǎn)業(yè)的知識(shí),,也更具有商業(yè)嗅覺(jué),,只要補(bǔ)足程式能力,,都有可能轉(zhuǎn)型成為未來(lái)炙手可熱的資料科學(xué)家。
從企業(yè)的角度出發(fā),,陳昇瑋說(shuō),,企業(yè)內(nèi)最理想的初始資料科學(xué)團(tuán)隊(duì)規(guī)模是五個(gè)人,包括一位PM(專案經(jīng)理),、一位Data Scientist(資料科學(xué)家),、兩位Data Engineer(資料工程師)跟一名Visual Designer(視覺(jué)設(shè)計(jì)師)。但如果企業(yè)沒(méi)有這幺多資源的話,,可以先從兩,、三個(gè)人訓(xùn)練起,先求有,、再求好,。陳昇瑋說(shuō),資料科學(xué)牽涉到典範(fàn)移轉(zhuǎn)(Paradigm Shift),,傳統(tǒng)倚賴經(jīng)驗(yàn),、現(xiàn)在倚賴測(cè)量;傳統(tǒng)資料是私有,,現(xiàn)在卻是開(kāi)放,。“典範(fàn)移轉(zhuǎn)本來(lái)就不是簡(jiǎn)單的事,但這是不得不做的事,。”
因此,,資料科學(xué)家也要具備一定的商業(yè)敏感度。“商業(yè)敏感度是『混』出來(lái)的,,他不會(huì)憑空出現(xiàn),。”隸屬于企業(yè)中數(shù)據(jù)部門(mén)的資料科學(xué)家,還要常和業(yè)務(wù)部的人經(jīng)常在一起,,不只是一起開(kāi)會(huì),,最好還要一起喝茶、吃飯,,讓彼此更加熟悉,。
正因?yàn)橘Y料科學(xué)家能從繁複的數(shù)據(jù)中“看到別人看不到的東西”,他們能夠重新定義問(wèn)題以及尋找答案,,為企業(yè)在無(wú)論消費(fèi)者行為分析,、商業(yè)決策等方面“解惑”,也讓資料科學(xué)家變成目前產(chǎn)業(yè)趨之若鶩的未來(lái)人才,。
“這已經(jīng)是現(xiàn)在進(jìn)行式,。”陳昇瑋說(shuō),資料科學(xué)目前已經(jīng)影響網(wǎng)路、金融業(yè),,未來(lái),,下一波沖擊又最可能會(huì)發(fā)生在倉(cāng)儲(chǔ)、餐飲,、製造業(yè)等傳統(tǒng)產(chǎn)業(yè),。因?yàn)榘ㄉa(chǎn)線、原物料,、供應(yīng)鏈,、庫(kù)存成本等,若能有更好的數(shù)據(jù)控管,,得出獨(dú)特的商業(yè)Insight(洞見(jiàn)),,資料科學(xué)家就能顛覆各個(gè)產(chǎn)業(yè)。
文章來(lái)源:機(jī)房監(jiān)控 http://rupm.cn
專線:劉剛 13911133352
E-mail:[email protected]
北京金恒智能系統(tǒng)工程技術(shù)有限責(zé)任公司 版權(quán)所有 Copyright 2007-2020 by Create-china.com.cn Inc. All rights reserved.
法律聲明:未經(jīng)許可,任何模仿本站模板,、轉(zhuǎn)載本站內(nèi)容等行為者,,本站保留追究其法律責(zé)任的權(quán)利!
電話:86+10-62104277/2248/4249 傳真:86+10-62104193-819 京ICP備10010038號(hào)-2網(wǎng)站XML
智慧機(jī)房
在線體驗(yàn)