關於數據的兩個誤區
平時無論是進行用户調研、產品運營還是競品分析,都少不了對於數據的分析,如果項目中出現某些分歧誰也無法説服誰時,很多時候也都是拿數據説話,可見在開發產品的時候,對數據的統計與分析十分重要。大家都説數據是客觀的,但其實數據受背景環境、統計者、統計方法、分析者看法等多重因素影響,以致我們在統計和分析時卻常常陷入誤區,得不到正確的答案。下面簡單説一下關於數據的兩個常見誤區。
誤區一:把某一類型數據當做全部數據導致分析結果錯誤 先説個小故事:二戰時英國空軍希望增加飛機的裝甲厚度,但如果全部裝甲加厚則會降低靈活性,所以最終決定只增加受攻擊最多部位的裝甲。後來工作人員經過對中彈飛機的統計,發現大部分飛機的機翼彈孔較多,所以決定增加機翼的裝甲厚度。後來一個專家説:“可是機頭中彈的那些飛機就沒有飛回來”。 這個故事裏本應是對全部飛機進行分析,但統計樣本沒有包含已經損毀的飛機,所以得出的結論只是根據部分數據,或者説是根據具有同樣特徵(受傷)的某一類數據推論出的,並不能代表全部類型的數據,所以得出的結果很可能是錯誤的。 再看一個例子:前一陣我為了分析人人網,想看看人人網現在的用户訪問量是什麼狀態,於是選擇了PV作為觀測指標,通過alexa來看人人網的PV在過去一年中呈明顯的下降態勢,這也印證了我的預期,於是就以此為論據進行了分析。可是後來發現,alexa僅僅統計通過WEB的訪問量,而用户移動端的登錄並不在統計範圍之內!這兩年智能手機普及迅速,移動端登錄也非常普遍,缺失這部分數據意味着前面統計的數據基本沒有意義,因為WEB端訪問量的下降有可能是用户訪問人人網次數降低,同時也有可能是由PC端向移動端遷移,這個統計就不能作為論據出現了。 從上面這個例子可以看到,我只統計了WEB端的訪問情況,認為這就是人人網全部訪問量,而忽略了移動端,從而推出了錯誤的結果。另一個問題就是由於我已經有預期(人人網訪問量下降),那麼我在為這個結論找尋相關的論據,當找到符合我結論的論據時很容易不去做更多判斷就選擇有利於自己的數據,這也是數據統計人員常見的問題。 用某一類型數據代替全部數據會誤導我們做出錯誤的判斷,在統計時一定要注意這點。這一方面需要意識,在統計、分析數據時要時刻想着還有沒有其他的情況,還有沒有我們沒有想到的數據類型,這些數據是不是能代表全部類型,嘗試站在更高的角度去解讀這些數據,而不是拿到數據後立刻就盲目分析。另一方面需要知識的累積,比如你知道alexa是如何進行統計的,那麼很輕易就會想到還要考慮移動端的情況。知識的累積有助於我們做出準確的判斷,這些知識與經驗都是從閲讀或實踐中得來的,平時多做,慢慢累積,時間久了自然會看得更全面。 誤區二: 鮮明事件讓我們誇大了偶然因素 鮮明的事件更容易佔據我們的視線,從而讓我們高估事件發生的概率。 比如從年度統計中看到,某基金近兩年的收益率達到100%,有某某明星操盤手等等,人們就會爭相去購買該基金,同時也會讓人們認為買基金就是可以賺錢的。而實際上,絕少有基金可以常年保持這樣的收益率,近兩年收益前五名的基金很可能在五年後收益率就排行倒數,而世面上大部分基金也無法跑贏大盤,不過人們在記憶中依然會認為買基金確實很賺錢,當年XXX兩年益100%呢。兩年收益達到100%只是偶然情況,但卻由於事件太過鮮明而長久駐紮在人們的心智中。 類似的事還有很多。比如富士康N連跳,大家都覺得這麼多人跳樓,富士康肯定太黑暗了,但大家卻沒有注意2010年深圳地區富士康員工大概有37萬人,2010年已知的富士康深圳地區自殺人數為14人,這樣的話話自殺率不到十萬分之四,而2010年全國的平均自殺率為十萬分之二十二(根據維基百科),N連跳自殺率遠低於全國自殺率,可見富士康N連跳實際上是一個社會問題,而不僅僅是一個企業的問題,我們太過注重鮮明的事實卻忽略了背後整體的概率。還有前兩天美國波士頓爆炸案死亡3人,微博上各種祈福,可是阿富汗、伊拉克等國家幾乎每天都面臨着這些問題,只是由於媒體不會整天報道那裏的消息,而天天出現的'襲擊也麻痺了人們的神經,所以我們只會關注鮮明的波士頓爆炸,而對其他地區天天發生的事情無動於衷。另外比如你周圍有人買股票賺了好多錢,可能你也會很想投身股市一試運氣,而忽略了散户8賠1平1賺的整體概率。你看到了各種創業成功者的報道,認為自己也可以嘗試創業,畢竟成功概率好像也不低。但你不知道那些不成功的人基本沒有被報道的機會,而實際上創業成功的人可能不到1%。 説了這麼多,其實就是太過鮮明的偶然事件會讓我們忽略背後一直存在的整體概率。看到這種數據的時候,不要太過情緒化,你所看到的數據或事件可能只是個例,並不能代表大多數,可以去查查歷史情況或平均情況,去找找沉默的用户或數據,切忌輕易就做出判斷和決定。要理性看待這些偶然事件,既不盲目跟隨,也不對此嗤之以鼻,在明確整體概率的情況下,剔除偶然因素,分析這些偶然事件背後是否存在着某些值得借鑑的地方,從而吸收到自己產品或項目中,以便使自己的產品或要處理的事情有可能成為市場中下一個“偶然事件”。
相關文章
-
關於數據分析常見的三大誤區
我們要意識到,用户“怎麼説”和“怎麼做”不同,甚至經常有矛盾,有時候用户的行為比語言更能反映出他的真實需求。比如用户説在搜索買家的時候應該加一個“按交易額搜索”的條件,也許只是他某次特殊的需要使然,但如果我們聽 -
關於數據分析與數據挖掘的數據10個問題
1,作為支付寶數據首席分析師,你怎麼看待“數據挖掘”這個詞?所謂的“數據挖掘”是基於用户的行為挖掘出有價值的東西,以及這個東西被用到商業環境上。比如非常著名的“啤酒與尿布”的案例,它的背景是在1992年的美國,每週四 -
職場的兩個誤區一定要避開
一位哲學家説過:不善於駕馭自己情緒的人總是會有所失。尤其是現在的社會中,競爭壓力大,超負荷工作的現象比比皆是。在工作中總是會遇到各種各樣的事情,自然也就會產生很多消極的情緒。如果這些消極情緒不能得到很好的排解 -
大學聯考數學備考:避免做數學題目的兩大誤區
馬上就快到我們的傳統中國年,帶上孩子一起動手為我們的新年做準備,領着孩子慢慢進入節日氛圍!今天跟大家分享的是傳統的剪紙——立體“平安”,文化的傳承從小抓起!!!創意來自網絡,圖片均為實拍!主要材料:彩紙所需工具:剪刀筆製作 -
關於育兒的8個誤區
誤區1:相信所有人和事寶寶出生的最初幾個星期,新手爸媽恨不能從所有身邊的人那裏尋找建議,千萬不要那樣做。因為,來自不同的人的意見往往有可能是相互矛盾的,比如一個熟人告訴新手爸媽要和寶寶睡在一起,但新手爸媽最好的朋 -
關於婚姻的九個誤區
1、必須找對人其實跟誰結婚都一樣,最後你需要面對的還是你自己。對方只是你愛自己的能力的一種反映。當你自己真正進步了,現有婚姻就是最好的。2、下一個伴侶會全然不同離異和更換伴侶並不是問題的解決辦法,它只不過是把 -
大學聯考平行志願中的兩個常見誤區解讀
先來解答一下平行志願中,退檔考生是如何處理的。高校錄取考生時,有許多因素要考慮,比如是否服從專業調劑,身體條件是否符合,因此,考生即使被學校提檔,也不一定能夠被學校錄取。這就存在着一個考生被學校提檔又被退檔的可能。 -
數據庫、數據庫管理系統跟數據庫系統的區別
口紅哪個牌子好?哪個品牌的口紅最好?在國外,很多女生的包裏都會備上一隻脣膏,不管這支脣膏是什麼顏色什麼牌子,她們都認為口紅能改變一個女人的命運。口紅能為女人增添好氣色,即使在沒有任何粧容的前提下,淡淡的紅脣便能讓你 -
大學聯考平行志願兩個常見誤區須知
先來解答一下平行志願中,退檔考生是如何處理的。高校錄取考生時,有許多因素要考慮,比如是否服從專業調劑,身體條件是否符合,因此,考生即使被學校提檔,也不一定能夠被學校錄取。這就存在着一個考生被學校提檔又被退檔的可能。 -
關於數據庫與銷售數據分析?
公司有5個品種,各個品種都有200多個客户,客户每個月有2-3次的進貨,所有客户由5名客户代表管理。因此,公司登記的'銷售信息每個月都有3000多條數據,一年下來有4萬多,如果再加上計劃、達成率等數據,那就更多了。作為管理人員,