當前位置:學問谷 >

校園範例 >其他 >

數據分析六部曲

數據分析六部曲

明確分析的內容和目的、數據收集、數據處理、數據分析、數據展現、報告撰寫等6個步驟。

數據分析六部曲

明確數據分析的目的和內容是確保數據分析過程有效的進行的先決條件,以便明確數據分析方向,保證不迷失方向。

數據收集是按照確定的數據分析內容,收集相關數據的過程,它為數據分析提供了素材和依據。這裏所説的數據包括第一手數據與第二手數據,第一手數據是指可以直接獲取的數據,第二手數據是指經過加工整理後得到的數據。一般數據來源主要有數據庫、互聯網、公開出版物、市場調查等形式。

數據處理:

是指對收集過來的數據進行加工處理,形成適合分析的樣式,它是數據分析必不可少的步驟。數據處理基本是從大量的、雜亂無章、難以理解的數據中推導出對解決問題有價值、有意義的數據。(數據處理主要包括數據清洗、數據轉化、數據提取、數據計算等方法。)

數據分析:

主要是指通過統計分析或者數據挖掘技術對處理過的數據分析,從中發現數據的內部關係和規律,為解決問題提供參考。

數據分析與數據處理的區別:數據處理是數據分析的基礎。通過數據處理,將收集到的原始數據轉換為可以分析的數據形式,並保證數據的一致性和有效性。如果數據本身存在問題,那麼即使採用最新進的數據分析方法,得到的結果也是錯誤的。

數據分析與數據挖掘的關係:數據挖掘就是一種高級的書分析方法,數據挖掘就是從大量的數據中挖掘出有用的信息,它是根據用户的特定要求,從浩瀚如煙的數據中找出所需要的數據,以滿足用户的需求。數據挖掘主要側重於解決四類數據分析問題:分類、聚集、關聯、預測。

數據展現:

數據是通過表格和圖形的方式呈現出來的,我們常説用圖標説話就是這個意思。常用的數據圖表包括餅圖、柱形圖、條形圖、折線圖、散點圖、雷達圖等。也可以對這些圖進行加工,展現出來我們所需要的圖。一般情況下用圖説明問題的就不用表格,用表格説明問題的就不文字。

報告撰寫:

數據分析報告其實就是對整個數據分析過程的'一個總結與呈現。通過報告,把數據分析的起因,過程,結果及建議完整的呈現出來,以供決策者參考。數據分析報告一定要有建議和解決方案,作為決策者,需要的不僅僅是找出問題,最重要的是建議和解決方案,以便他們在決策時候做參考。所以數據分析師不僅僅需要掌握數據分析的方法,而且還需要了解和熟悉業務,這樣才能根據發現的業務問題,提出具有可行性的建議和解決方案。

數據分析常用的指標和術語:

平均數:一般指的是算數平均數。算數平均數是非常重要的基礎性指標。平均數是綜合指標,它的特點是將總體內各單位的數量差異抽象化,代表總體的一邊水平,掩蓋總體內各單位的差異。

絕對數與相對數

絕對數是反映客觀現象總體在一定時間、地點條件下的總規模、總水平的綜合性指標。也就是數據分析中的常用指標,如:GDP,總人口等。

相對數是指由倆個有聯繫的指標對比計算而得到的數值,它是反映客觀現象之間數量連續程度的綜合指標。計算相對數的基本公式:相對數=比較數值(比數)/基礎數值(基數)

説明:分母就是用作對比標準的指數數值,簡稱基數。分鐘是用做與基數對比的指數數值,簡稱比數。相對數一般以倍數、成數、百分數等表示,它反映了客觀現象之間數量聯繫的程度。

百分比與百分點:百分比是相對數的一種,它表示一個數是另一個數的百分之幾,也稱百分率或者百分數。百分比通常採用百分號來表示。由於百分比的分母都是100,也就是以1%作為度量單位,由於比較便捷,被廣泛應用。百分點是指不同的時期以百分數的形式表示的相對指標的變動幅度。

頻數與頻率:頻數是指一組數據中個別數據重複出現的次數。頻率是指每組類別次數與總次數的比值,它代表某類別在總體中出現的頻繁程度,一邊用百分數表示。

比例與比率:比例是指在總體中各部分的數值佔全部數值的比重,通常反映總體的構成和結構。比率是指不用類別數值的對比,它反映的不是部分與整體之間的關係,而是一個整體各部分之間的關係。

倍數與番數:倍數與番數同樣屬於相對數。倍數是一個數吃了另一個數所得的商,倍數一般是表示數量增長或上升幅度而不適用於表示數量的減少或者下降。番數是指原來數量的2的N次方倍。

同比和環比:同比是指與歷史同期進行比較得到的值,該指標主要是反映的是事物發展的相對情況。環比是指與前一個統計期進行比較得到的值,該指標主要是反映的是事物逐漸發展的情況。


標籤: 數據分析 六部
  • 文章版權屬於文章作者所有,轉載請註明 https://xuewengu.com/flxy/qita/94gqne.html