關於數據的兩個誤區

2016-09-09

平時無論是進行用户調研、產品運營還是競品分析，都少不了對於數據的分析，如果項目中出現某些分歧誰也無法説服誰時，很多時候也都是拿數據説話，可見在開發產品的時候，對數據的統計與分析十分重要。大家都説數據是客觀的，但其實數據受背景環境、統計者、統計方法、分析者看法等多重因素影響，以致我們在統計和分析時卻常常陷入誤區，得不到正確的答案。下面簡單説一下關於數據的兩個常見誤區。

誤區一：把某一類型數據當做全部數據導致分析結果錯誤先説個小故事：二戰時英國空軍希望增加飛機的裝甲厚度，但如果全部裝甲加厚則會降低靈活性，所以最終決定只增加受攻擊最多部位的裝甲。後來工作人員經過對中彈飛機的統計，發現大部分飛機的機翼彈孔較多，所以決定增加機翼的裝甲厚度。後來一個專家説：“可是機頭中彈的那些飛機就沒有飛回來”。這個故事裏本應是對全部飛機進行分析，但統計樣本沒有包含已經損毀的飛機，所以得出的結論只是根據部分數據，或者説是根據具有同樣特徵(受傷)的某一類數據推論出的，並不能代表全部類型的數據，所以得出的結果很可能是錯誤的。再看一個例子：前一陣我為了分析人人網，想看看人人網現在的用户訪問量是什麼狀態，於是選擇了PV作為觀測指標，通過alexa來看人人網的PV在過去一年中呈明顯的下降態勢，這也印證了我的預期，於是就以此為論據進行了分析。可是後來發現，alexa僅僅統計通過WEB的訪問量，而用户移動端的登錄並不在統計範圍之內!這兩年智能手機普及迅速，移動端登錄也非常普遍，缺失這部分數據意味着前面統計的數據基本沒有意義，因為WEB端訪問量的下降有可能是用户訪問人人網次數降低，同時也有可能是由PC端向移動端遷移，這個統計就不能作為論據出現了。從上面這個例子可以看到，我只統計了WEB端的訪問情況，認為這就是人人網全部訪問量，而忽略了移動端，從而推出了錯誤的結果。另一個問題就是由於我已經有預期(人人網訪問量下降)，那麼我在為這個結論找尋相關的論據，當找到符合我結論的論據時很容易不去做更多判斷就選擇有利於自己的數據，這也是數據統計人員常見的問題。用某一類型數據代替全部數據會誤導我們做出錯誤的判斷，在統計時一定要注意這點。這一方面需要意識，在統計、分析數據時要時刻想着還有沒有其他的情況，還有沒有我們沒有想到的數據類型，這些數據是不是能代表全部類型，嘗試站在更高的角度去解讀這些數據，而不是拿到數據後立刻就盲目分析。另一方面需要知識的累積，比如你知道alexa是如何進行統計的，那麼很輕易就會想到還要考慮移動端的情況。知識的累積有助於我們做出準確的判斷，這些知識與經驗都是從閲讀或實踐中得來的，平時多做，慢慢累積，時間久了自然會看得更全面。誤區二：鮮明事件讓我們誇大了偶然因素鮮明的事件更容易佔據我們的視線，從而讓我們高估事件發生的概率。比如從年度統計中看到，某基金近兩年的收益率達到100%，有某某明星操盤手等等，人們就會爭相去購買該基金，同時也會讓人們認為買基金就是可以賺錢的。而實際上，絕少有基金可以常年保持這樣的收益率，近兩年收益前五名的基金很可能在五年後收益率就排行倒數，而世面上大部分基金也無法跑贏大盤，不過人們在記憶中依然會認為買基金確實很賺錢，當年XXX兩年益100%呢。兩年收益達到100%只是偶然情況，但卻由於事件太過鮮明而長久駐紮在人們的心智中。類似的事還有很多。比如富士康N連跳，大家都覺得這麼多人跳樓，富士康肯定太黑暗了，但大家卻沒有注意2010年深圳地區富士康員工大概有37萬人，2010年已知的富士康深圳地區自殺人數為14人，這樣的話話自殺率不到十萬分之四，而2010年全國的平均自殺率為十萬分之二十二(根據維基百科)，N連跳自殺率遠低於全國自殺率，可見富士康N連跳實際上是一個社會問題，而不僅僅是一個企業的問題，我們太過注重鮮明的事實卻忽略了背後整體的概率。還有前兩天美國波士頓爆炸案死亡3人，微博上各種祈福，可是阿富汗、伊拉克等國家幾乎每天都面臨着這些問題，只是由於媒體不會整天報道那裏的消息，而天天出現的'襲擊也麻痺了人們的神經，所以我們只會關注鮮明的波士頓爆炸，而對其他地區天天發生的事情無動於衷。另外比如你周圍有人買股票賺了好多錢，可能你也會很想投身股市一試運氣，而忽略了散户8賠1平1賺的整體概率。你看到了各種創業成功者的報道，認為自己也可以嘗試創業，畢竟成功概率好像也不低。但你不知道那些不成功的人基本沒有被報道的機會，而實際上創業成功的人可能不到1%。説了這麼多，其實就是太過鮮明的偶然事件會讓我們忽略背後一直存在的整體概率。看到這種數據的時候，不要太過情緒化，你所看到的數據或事件可能只是個例，並不能代表大多數，可以去查查歷史情況或平均情況，去找找沉默的用户或數據，切忌輕易就做出判斷和決定。要理性看待這些偶然事件，既不盲目跟隨，也不對此嗤之以鼻，在明確整體概率的情況下，剔除偶然因素,分析這些偶然事件背後是否存在着某些值得借鑑的地方，從而吸收到自己產品或項目中，以便使自己的產品或要處理的事情有可能成為市場中下一個“偶然事件”。

標籤：