返回頂部
關(guān)閉軟件導(dǎo)航
位置:首頁(yè) > 資訊 > 電商資訊>阿里大數(shù)據(jù)部門(mén)真實(shí)工作場(chǎng)景和你想象的一樣嗎
阿里大數(shù)據(jù)部門(mén)真實(shí)工作場(chǎng)景和你想象的一樣嗎

老板:我是一家手機(jī)公司的老板,今天要向去董事局匯報(bào),我要預(yù)備一份介紹過(guò)去三年的用戶增長(zhǎng)、用戶留存、用戶活躍度、手機(jī)里面每個(gè)APP使用率等情況的報(bào)表,假如下面沒(méi)我下面沒(méi)有BI,那我肯定就蒙逼了。。

BI:我是一名非技術(shù)BI,我天天看競(jìng)品的分析報(bào)告,看雙十一銷(xiāo)量,看各種評(píng)論,知道自己的產(chǎn)品有哪些短板有哪些優(yōu)點(diǎn),我分析南北地域差異,國(guó)內(nèi)外客戶喜好,總之我在手機(jī)領(lǐng)域有著很強(qiáng)的行業(yè)解讀能力和數(shù)據(jù)解讀能力,我可以畫(huà)出非常漂亮的圖表和PPT。

今天老板讓我出一份報(bào)表,我還要去刷臉找ETL工程師幫我跑出這次報(bào)告的數(shù)據(jù),基于這份數(shù)據(jù)我要給出一定的解讀,為啥這個(gè)月手機(jī)賣(mài)得不如上個(gè)月,為啥用戶流失越來(lái)越嚴(yán)重等等都是我要去做的。

阿里大數(shù)據(jù)部門(mén)真實(shí)工作場(chǎng)景和你想象的一樣嗎1

ETL工程師:我是食物鏈很底層的苦逼ETL工程師,我會(huì)寫(xiě)shell、我會(huì)搭hadoop/hive/hbase、會(huì)寫(xiě)超復(fù)雜邏輯的sql,今天那個(gè)不會(huì)自己計(jì)算數(shù)據(jù)的BI又讓我跑幾個(gè)數(shù)據(jù),我本想讓她提需求流程的,但她說(shuō)這是老板要的(運(yùn)營(yíng)慣用的殺手锏!!!),要加急處理。

我只能放下手頭的活兒給她跑數(shù)據(jù)了,花了半個(gè)小時(shí)把數(shù)據(jù)跑好給她,希望能就這么交差吧。

假如你以為我天天就做這點(diǎn)事那你就錯(cuò)了,我平時(shí)的工作可不僅僅就是完成上面交給我的任務(wù)哦,我還負(fù)責(zé)數(shù)據(jù)ETL過(guò)程、數(shù)據(jù)建模、定時(shí)任務(wù)的分配、甚至有時(shí)Hadoop集群的維護(hù)等等都得我去做,每件事單獨(dú)拿出來(lái)都可以拿出來(lái)寫(xiě)本書(shū)。

就拿ETL過(guò)程來(lái)說(shuō)吧,你要把原始數(shù)據(jù)從各種數(shù)據(jù)庫(kù)、各種服務(wù)器的不同業(yè)務(wù)日志歸一化到同一類(lèi)格式,要約定好分隔符,然后導(dǎo)入到分布式文件系統(tǒng)HDFS,甚至你還要和業(yè)務(wù)系統(tǒng)定義數(shù)據(jù)格式出規(guī)范。

數(shù)據(jù)收集完,你還得出中間表,數(shù)據(jù)過(guò)濾,格式統(tǒng)一,ID統(tǒng)一,維度統(tǒng)一,通過(guò)不同的數(shù)據(jù)現(xiàn)象進(jìn)行數(shù)據(jù),完了,你就得出一些日?qǐng)?bào)周報(bào)之類(lèi)的數(shù)據(jù)了,這時(shí)候你要按照需求把數(shù)據(jù)組織成一定的格式然后到Mysql、或者HBASE等等。

總之你就是需要把數(shù)據(jù)各種收集、各種處理、然后各種導(dǎo)入導(dǎo)出,是不是很有意思?

不過(guò)這些數(shù)據(jù)倉(cāng)庫(kù)都非常初級(jí),其中ETL工程師可發(fā)揮的空間太多了

1、正常情況下,老板—>BI—>ETL出一份報(bào)告,這中間能否BI直接去計(jì)算數(shù)據(jù)?sql太復(fù)雜,那么可不可以一切數(shù)據(jù)標(biāo)簽化,BI甚至老板要什么就選什么?

2、ETL工程師可以把數(shù)據(jù)收集自動(dòng)化、可以規(guī)范業(yè)務(wù)日志格式、可以將一切都配置化,但是這些都是基于N+1的,也就是說(shuō)今天的發(fā)生了什么一定要到明天才能看到,那么有沒(méi)有一個(gè)系統(tǒng)能把數(shù)據(jù)分析做到實(shí)時(shí)或者準(zhǔn)實(shí)時(shí)?參考雙十一大屏,馬總要是到12號(hào)才能知道成交了多少筆不劈了那幫做數(shù)據(jù)的才怪。

3、目前絕大部分分析系統(tǒng)都基于離線計(jì)算(HADOOP/ODPS),那這里有個(gè)問(wèn)題了,運(yùn)營(yíng)或BI想看個(gè)數(shù)據(jù)還得你離線慢騰騰跑完才能看到,那么有沒(méi)有一個(gè)系統(tǒng)可以支持你再大的數(shù)據(jù)量,再?gòu)?fù)雜的邏輯,毫秒出數(shù)據(jù)?

阿里大數(shù)據(jù)部門(mén)真實(shí)工作場(chǎng)景和你想象的一樣嗎2

我們有提到的還有算法工程師、大數(shù)據(jù)運(yùn)維工程師等等。

數(shù)據(jù)倉(cāng)庫(kù)的概念很廣很大,但在大數(shù)據(jù)應(yīng)用面前也不值一提。

阿里大數(shù)據(jù)部門(mén)真實(shí)工作場(chǎng)景和你想象的一樣嗎3

假如把數(shù)據(jù)價(jià)值分層,這里分層的辦法很多,我只列舉一種方法,有人分過(guò)5層

第一層:為老板提供決策支持,例如傳統(tǒng)的財(cái)務(wù)報(bào)表

第二層:為運(yùn)營(yíng)提供決策支持,例如數(shù)據(jù)化非常徹底的淘寶運(yùn)營(yíng)們

第三層:為產(chǎn)品提供支持,例如有產(chǎn)品經(jīng)理們會(huì)拿著報(bào)表天天看研究自己的某一個(gè)按鈕擺放位置對(duì)不對(duì)

第四層:數(shù)據(jù)用于生產(chǎn),比如直接對(duì)接廣告系統(tǒng)產(chǎn)生收益,比如直接對(duì)接推薦系統(tǒng)為用戶推薦商品,實(shí)現(xiàn)千人千面,再比如利用手機(jī)APP直接給不同用戶push消息

第五層:大數(shù)據(jù)交換,數(shù)據(jù)產(chǎn)生直接收益

大部分公司能做到前兩個(gè)層次就已經(jīng)很不錯(cuò)了,假如能做到第三層,就已經(jīng)很牛逼,做到第四第五層次,國(guó)內(nèi)互聯(lián)網(wǎng)公司不超過(guò)3家,阿里和騰訊可以做到,大數(shù)據(jù)應(yīng)用太大了,不知從何說(shuō)起,以后聊吧。

如果您覺(jué)得 阿里大數(shù)據(jù)部門(mén)真實(shí)工作場(chǎng)景和你想象的一樣嗎 這篇文章對(duì)您有用,請(qǐng)分享給您的好友,謝謝
文章地址:http://www.meyanliao.com/article/online/10122.html
解放雙手無(wú)盡可能,有問(wèn)題添加天線貓微信
主站蜘蛛池模板: 亚洲av日韩av无码av| 亚洲成?v人片天堂网无码| 国产精品无码专区在线观看| 精品无码av无码专区| 久久久久亚洲?V成人无码| 亚洲AV永久纯肉无码精品动漫| 欧洲Av无码放荡人妇网站 | 青青草无码免费一二三区| 无码人妻精品中文字幕免费东京热 | 无码人妻AⅤ一区二区三区水密桃| 中文字幕无码免费久久99| 中文无码熟妇人妻AV在线| 亚洲成a人片在线观看天堂无码| 国产亚洲精久久久久久无码| 日韩av片无码一区二区不卡电影| 无码激情做a爰片毛片AV片| 亚洲AV无码乱码在线观看富二代| 国产在线精品无码二区二区| 未满十八18禁止免费无码网站| 日韩av无码免费播放| 日韩AV无码精品一二三区| 亚洲国产成人精品无码区在线秒播 | 亚洲中文字幕无码久久2020| 无码无套少妇毛多69XXX| 久久久久精品国产亚洲AV无码| 中文字幕av无码一区二区三区电影 | 无码人妻一区二区三区免费手机| 曰韩无码AV片免费播放不卡| 伊人久久大香线蕉无码| 无码人妻精品一区二区三区蜜桃 | av潮喷大喷水系列无码| 亚洲av无码专区国产乱码在线观看| 亚洲成A∨人片天堂网无码| 影音先锋无码a∨男人资源站| 性虎精品无码AV导航| 无码国产精品一区二区免费I6 | 国产成人无码免费网站| 日韩电影无码A不卡| 综合国产在线观看无码| 亚洲一区无码中文字幕| 人妻夜夜添夜夜无码AV|