當前位置:學問谷 >

校園範例 >其他 >

數據分析三部曲

數據分析三部曲

University Of Maryland的Shneiderman教授把數據分析的過程歸納為三大步:Overview,Zoom&Filter,Detail-on-demand。可以大致簡譯為:全盤觀察,深入及過濾,及時獲取詳細數據。這三步可以説缺一不可。不僅是數據分析的一個主要的流程,也是數據分析軟件所必須提供了功能。我們在這裏來簡單看一看每一步的工作和需要的工具支持。

數據分析三部曲

全盤觀察

對數據的一個全盤觀察是每一個數據分析的起始點。除非你已經有一個明確的分析重點,一個全面的數據呈現界面可以讓你很快地判斷出你是否需要進一步的分析,或者進一步分析的方向。但很多BI軟件往往忽約了這一點。

設計一個分析界面時,如果我們要求用户做很多工作才能看到一個全面的情況,用户就失去了一個很快掌握全局的機會。比如下面的一個Dashboard。

通過對這個界面的初步分析,我們知道數據被按照地區(Location)分成了不同的視圖。如果一個用户需要找到感興趣的地區,他就需要一個一個地區的去點擊。這不僅被迫用户做出不必要的操作,而且完全打斷了用户的思路。如果用户需要對不同地區進行比較,等到點擊到幾個地區之後,大概也已經忘記最初始的情況了。

提供一個全局的展現,當然也不是隻是一個理念就能解決的問題。如果我們想把大量的數據集成在一個界面,不需任何切換就可以觀察,就需要相應的軟件支持。比如子彈圖,Sparkline等等工具。在這裏就不詳細描述了。

深入及過濾

一旦用户找到了感興趣的方面,第二步的工作就需要縮小範圍,更進一步分析相關的數據。從實現的角度,這裏有兩種可能。第一,如果可能的話,用户可以直接在全盤的界面上做一些放大和過濾的工作。但因為空間的限制,往往一個全局的界面已經比較擁擠,同時包含一些詳盡分析功能有一些困難。

如果是這種情況,我們可以提供一個快捷的切換功能,讓用户可以在保持當前環境(Context)的情況下,迅速地切換的新的界面。在這個步驟裏,用户需要很強大的功能從不同的角度,不同的層次對數據進行顯示和操作。這些操作主要包括數據過濾,圖表切換,數字比較及再計算等等。

數據過濾的目的是靈活地縮小數據的範圍。根據不同的數據種類,我們可以選擇合適的工具,比如可選列表,可拉動滾動條等。

作為數據的.重要顯示渠道,圖表本身也應該提供大量的數據過濾與操作功能。比如用户應該可以快捷地轉換數據顯示形式,進行不同的排序,計算,和比較。這些可以通過一些預先設計的界面,讓用户用最簡單的形式和數據互動。或者通過一個完全開放的界面,讓用户任意地定義圖表的展示。

以下是StyleScope的終端用户界面。

及時獲取詳細數據

分析的目的,是找到有用的信息,從而採取相應的措施。而最後的決定,往往還是需要落實到具體的事件。所以從分析的綜合數據到低層的細節數據是至關重要的一步。這個問題貌似簡單,但卻是很多分析軟件的一個軟肋。

最傳統的分析方案,OLAP,通過提前計算彙總數據來達到更高的速度。但這樣的直接後果是彙總數據和詳細數據的關係就常常失去了。雖然新的OLAP系統通常會提供一個解決方案,但往往結果並不是最優化。

另一個需要解決的問題是用户怎樣選擇需要的詳細數據。一個常用的方法是直接在圖表上通過選擇數據點,然後直接鏈接到詳細數據上。

Via:數據文化

  • 文章版權屬於文章作者所有,轉載請註明 https://xuewengu.com/flxy/qita/99okl.html