Homework1-整理面試題目 ========= >contributed by [name=鴨鴨] ## 格式範本 ``` 公司名稱: 職務說明: 面試題目: 流程: 出處: ``` --- # 1. **公司**:VMFive **職務說明**:Data Scientist **面試題目** : 線下測試 申論題(英文) ``` 1. 資料科學家和資料工程師的不同在哪? Ans : 資料科學家(Data Scientist) 主要是在設計、建立並解釋模型 資料工程師(Data Engineer) 主要是針對資料的取得、前處理和儲存,並且要維護系統的正常運作 參考 : (http://blog.bryanbigdata.com/2014/07/vs.html) 2. 假設可以拿到無限的資料,你需要哪一些來幫助你投放廣告? Ans : (1)使用者的個人資料,包含性別、年齡、興趣和位置 (2)使用者點擊過哪些廣告和停留時間 (3)使用者之間的關係圖(社群媒體中是否為好友) (4)廣告的分類(Topic),例如遊戲、運動、電影等.... then? 利用使用者的基本資料和點擊過哪些廣告,找出興趣與廣告主題相符且真的停留長時間觀看完整個廣告的類別作為首選推薦 並利用關係圖做porpagation 來預測原本使用者沒點擊過的廣告,但可能因為好友的分享而造成他觀看到這則廣告,而增加的廣告影響力 參考 : Me ``` ``` 3. 你覺得你能不能領導一個團隊? ``` **流程**: (1)線下測驗,原PO大概花一天時間寫完(如面試題目) (2)與CEO面談 **出處** : http://webptt.com/m.aspx?n=bbs/Tech_Job/M.1450839672.A.695.html --- # 2. **公司** : Appier **職務說明** : Machine Learning Scientist/Data Backend Engineer **面試題目** : ``` (1)依照履歷詢問過網經驗 (2)Real Time Bidding 概念 Ans : 即時競價,交由廣告商決定廣告要給哪些用戶看,廣告商會分析用戶的特性,把適當的廣告推薦給用戶 參考 : https://goo.gl/9SwFhV (3)quick sort上機實作,但限制記憶體用量 (4)白板題 - hadoop 中 runtime 某個地方異常得慢或資源用量異常,說明原因 Ans : 基本上系統就是 A 出事,但原因通常是 C or D 設定值過大或過小 就是要從 D 開始說明,一路到影響的 C -> B,最後到結果 A 參考 : [研替](https://www.ptt.cc/bbs/Tech_Job/M.1444567910.A.731.html) (5)有限資源下如何處理龐大資料? ``` **流程** : [正職] (1)兩位ML team面談 (2)CEO面試 [研替] (1)現場上機考(如ACM) (2)白板題面試 (3)CTO與CEO二面 **出處** : (1)[正職](https://www.ptt.cc/bbs/Soft_Job/M.1416218318.A.B77.html) (2)[研替](https://www.ptt.cc/bbs/Tech_Job/M.1444567910.A.731.html) --- # 3. **公司名稱**:Yahoo **職務說明**:Search team **面試題目**: ``` (1)http概念 (2)linux command (3)design pattern (4)某個演算法 worst case (5)是否熟悉 hadoop (6)寫程式時宣告public 和 private 的差異 ``` **流程**: (1)Phone interview (2)智力測驗 (3)上機考(如ACM) **出處**: (1)https://www.ptt.cc/bbs/Soft_Job/M.1416218318.A.B77.html (2)https://www.ptt.cc/bbs/Tech_Job/M.1424610896.A.DA6.html