阿里數據分析師校招筆試題參考
- 筆試
- 關注:2.26W次
1觀測宇宙中單位體積內星球的個數,屬於什麼分佈:
A學生分佈B泊松分佈C正態分佈D二項分佈
2一些關於數據挖掘説法是正確的
A數據挖掘是萬能的
B如果你建立了一個database,那就意味着你已經有足夠的數據可以做數據挖掘了
C數據挖掘=數據+算法,數據挖掘人員大部分的時間用來處理複雜的`挖掘算法
DABC均有錯
3已知隨機變量X,Y分別服從泊松分佈P(S),卡方分佈X2(t),E(X)=4,D(Y)=9,則參數s,t分別:
A2,9;B4,9C4,4.5;D2,4.5
4下面算法中哪一種不屬於廣義線性迴歸算法
A生存模型算法 Bbeta迴歸算法 Clogit迴歸算法 D判別分析算法
5有一列1000萬淘寶買家的淘寶運費險保費數據,要計算該列數據的P1-P100分位數,可使用哪個SAS語句?
Aproc sort Bproc rank Cproc univariate Dproc freq
6X服從區間(2,6)上的均勻分佈,求對X進行3次獨立觀測中,至少有2次的觀測值大於3的概率。
A0.84375 B0.75275 C0.65275 D0.80370
7下面對於“預測變量間可能存在較嚴重的多重共線性”的論述中錯誤的是?
A迴歸係數的符號與專家經驗知識不符 B方差膨脹因子(VIF)<5
C其中兩個預測變量的相關係數>=0.85 D變量重要性與專家經驗嚴重違背
8由於淘寶買家消費數據是億級別,假設為了快速計算買家每月的平均消費額,採用抽樣1W個買家來計算
A採用分層抽樣方法把全量淘寶買家按照星級,每層抽取相同的數量,計算平均值
B採用系統抽樣方法,把全量買家隨機排序,每隔一定數量抽一個,計算平均值
C採用無放回隨機方法,從全量買家中隨機挑選一個買家,不放回,如此循環
D採用有放回隨機方法,從全量買家中隨機挑選一個買家,然後再放回,如此循環
9請找出數列4,9,23,60,157的下一項()
A 411 B 314 C 425 D ABC均錯
11以下哪個語法不是R的基礎語言
Aproc glot Bselect *from table
Ckc<-kmeans(data,3) Dprint”hello world”
Esd<-summary(data) Fimport
12分析師在工作中的良好習慣是
A將工作空間的密碼共享給別人 B將數據下載到私人電腦進行分析處理
C在處理資源高峯期提交大任務運算 D不定期地將分析報告分享給團隊
E定期清理存儲空間 F固話日常需要分析的數據表方便計算
16請分析淘寶消費者的流失情況
17淘寶和天貓上每天都有大量的用户在線上購買,作為分析師可以從哪些角度對用户進行分析,説明理由
20已知A商家近五年每月的成交數據,請列出兩種不同的時間序列預測模型可以用來預測商家接下來三個月的成交,並詳細闡述在使用每一種方法前需要對數據進行什麼預處理以及具體方法
21你理解中的分析師是什麼樣的?你覺得自己目前應聘分析師職位的優勢是什麼?並説明理由。
- 文章版權屬於文章作者所有,轉載請註明 https://xuewengu.com/flzc/bishi/54m0rq.html