當前位置:學問谷 >

校園範例 >其他 >

數據分析師都幹啥?

數據分析師都幹啥?

數據分析師,簡單切詞為“數據”,“分析”,“師”。因此,獲取必要的數據,分析這些數據,然後從數據中發現一些問題提出自己的想法,這就是一個數據分析師的基本工作內容。

數據分析師都幹啥?

自己做了兩年數據分析師,真的覺得古語説的對,“功夫在詩外”。一名好的數據分析師,接到一個需求時,會更多考慮這個需求本身,包括要做的東西是什麼,為什麼這麼做,還可以怎麼做,怎麼去做,關鍵點是什麼。都想清楚了,才去動手做。建議任何一名數據分析人員,都能在做以前把問題想清楚,確認清楚,不要等到做完才發現自己做錯了,那樣會很浪費時間。自己這方面曾犯過N多錯誤。

下面簡單談下做一名數據分析師要經歷的幾個步驟:

(1)獲取數據

獲取相關的數據,是數據分析的前提。每個企業,都有自己的一套存儲機制。比如淘寶,所有的數據都在HADOOP上,很多數據都要經過HADOOP,hive來獲取。因此,基礎的SQL語言是必須的'。具備基本SQL基礎,再學習下HIVE的細節的語法,基本就可以通過HIVE拿到很多數據了。每個需求明確以後,都要根據需要,把相關的數據獲取到,做基礎數據。

(2)數據處理

獲取數據,把數據處理成自己想要的東西,是一個關鍵點。很多時候,有了數據不是完成,而是分析的開始。數據分析師最重要的工作就是把數據根據需求處理好,只有數據跟需求結合起來,才能發揮數據的價值,看到需求的問題和本質所在。如果連數據都沒處理好,何談從數據中發現問題呢?

對於數據的處理,有兩種形式:

a>如果初步提取的數據是在LINUX上,建議學一門腳本語言,比如AWK,或者PYTHON。如果掌握一門腳本語言,不僅可以在LINUX系統上寫很多自動腳本來運行,會大大節省自己的時間,而且可以通過腳本語言把基礎數據處理成自己想要的任何形式,直接可以使用。

b>如果數據沒有在LINUX上,那可以download,然後通過其他統計軟件來處理。個人推薦SAS或者R語言。SAS的強大,不必多説。沒有SAS解決不了的問題,而且SAS也有SQL,處理起來也方便。R語言最近也很火,而且免費,packages越來越多,畫圖也簡單,類似Matlab。如果前期數據處理的好,後續只需要通過R或者SAS畫一些圖就可以了。在數據分析師的世界,按照價值排序,圖>表>文字。

(3)分析數據

這裏的數據,包括圖,表,數字幾種。分析數據是整個分析的關鍵,也考驗分析師的水平。好的分析師,可以根據趨勢圖,對比數據,敏鋭的觀察到很多問題。可是這需要對業務,對數據有很深的瞭解,才會把數據和業務結合起來,發揮兩者的價值,完成需求。所以,一名數據分析師,要把更多的時間放在瞭解業務上。只有業務瞭解,細節清楚,才會明白業務變動可能引起的數據指標的變動,也會在後續的需求分析中,更快更全面的解決其他人提出的問題。可能很多人都很困惑,怎麼才能“敏鋭”的觀察到數據的變動呢,我為什麼怎麼也發現不了問題呢?個人感覺可以通過以下方法,來慢慢鍛鍊:

a>多問幾個為什麼。比如,看到一些指標,就想想這些指標代表什麼,用自己的話可以怎麼理解;看到一條趨勢線有波動,就想想為啥子某個點異常波動呢?多問問問題,自己就會加深對業務和指標關聯的敏感性。

b>借鑑統計方法。統計學中,都會有一些橫縱對比,趨勢分析等等。對比,在分析師數據時候,是一個很重要的東西。任何東西,也因為了對比,才會有高有低,有長有短。另外,分佈,也是一個很好的東西。分佈的變化,就意味着變動,變動的發展結果,就能知道業務發展的好壞。再次,佔比啊等等,都是很簡單但是實用的方法。

c>向師兄請教。有的時候,一個問題,自己沉迷其中不能自拔,旁觀者一句話,就能點清自己的思路。當自己分析數據不得要領的時候,就多請教師兄。

(4)展示成果

分析數據以後,解決需求的問題,就需要彙總分析的成果,給到其他人。可能分析的過程,拿到的數據有很多,需要全部給其他人麼?怎麼去羅列這些數據呢?可能很多人都犯難。有一次,一個同學來問我,她有很多數據,但是就是不知道該怎麼組織,才能證明自己的結論是對的。其實,作為一名數據分析師,就是根據數據,把問題解決,提出一兩條參考建議給到需求方就OK了。因此,回覆的結果簡單明瞭就好。如果是回覆一封郵件,可以這樣來做:

a>郵件正文,先寫主要結論,即根據數據和需求,有什麼結論。這樣大家第一眼就能抓到最關鍵的東西,可能不需要看那些詳細的數據;

b>如果覺得有必要,就在下面再把分析過程寫進去;

c>如果圖和圖表不多,可以添加到郵件第三部分。畢竟放上數據,任何同學有疑問,可以隨時去看數據。如果圖和圖表實在太多,就放到附件!

其實,做一名數據分析師,真的不容易,不僅要懂業務,還要會技術,更要敏鋭發現問題,總結,還要提出建議。自己幹了N多工作,最後還不一定能得到一個好的結果。做了兩年數據分析師,自己的重心也在慢慢的轉移。從剛開始技術學習,到後面技術+業務的結合,到現在自己又鑽到業務,研究業務,慢慢發現:一名好的數據分析師,是一個好的產品的規劃者和行業的領跑者。

標籤: 分析師
  • 文章版權屬於文章作者所有,轉載請註明 https://xuewengu.com/flxy/qita/klmwn.html