# 信件內容 老師、助教們好: 我們是Final Project第18組, 非常感謝助教的來信,不好意思前封信件沒有解釋清楚,讓老師與助教可能沒有理解我們這組是如何決定使用One piece這兩門課的方式,因此在此附上更詳細解釋。 1. One piece是透過廣告以及助教所提供的驗證集資料 (val_seen.csv+val_unseen.csv)統計驗證集所有使用者課程購買數量而來,並非透過爬蟲來決定,爬蟲結果僅於投影片中使用,且爬蟲結果只用來驗證我們對"廣告影響購買意願的猜想"。廣告與驗證集統計如下: ![](https://i.imgur.com/ORTP9ZD.png =70%x) ![](https://i.imgur.com/QtaNonF.png =70%x) 2. 由於助教在介紹投影片有放上Hahow網站資訊,包含修課人數、評分等資訊,因此我們的想法就單純只是使用此資訊來作為佐證,所以才透過爬蟲來爬取相關資訊。 助教投影片第6頁 ![](https://i.imgur.com/omPo6JS.png) 助教投影片第7頁 ![](https://i.imgur.com/xwkJNog.png) 教授上課投影片,FinalProject.pdf第五頁 ![](https://i.imgur.com/P1Nmiis.png) 3. 2022/12/29第一次deadline前我們皆未使用One Piece課程,當時Kaggle分數如下(當時只有public): | Task | Public Score | Rank | |:-------------:|:------------:|:----:| | Seen Course | 0.187 | 3 | | Unseen Course | 0.14412 | 5 | | Seen Topic | 0.33937 | 1 | | Unseen Topic | 0.32134 | 9 | 下圖附上我們這組在2023/01/02第二次deadline的結果(沒有使用onepiece以及之前的方法的結果,並且之前的方法的繳交紀錄也有在第二次deadline之前): | Task | Public Score | Rank | Private Score | Rank | |:-------------:|:------------:|:----:|:-------------:|:----:| | Seen Course | 0.19365 | 2 | 0.19872 | 3 | | Unseen Course | 0.23586 | 1 | 0.23275 | 1 | | Seen Topic | 0.34135 | 2 | 0.3416 | 1 | | Unseen Topic | 0.4 | 1 | 0.40933 | 1 | ※ 我們的 Unseen User Topic 在Private公布後最好的成績也不是使用Onepiece的方法(Onepiece在這個task是第二好的) ※ 其他的task用我們提交的程式直接去掉Onepiece分數會較低,我們附上之前的方法(沒用Onepiece)的結果 ![](https://i.imgur.com/IGX0ut3.png) ![](https://i.imgur.com/ydBlCW9.png) ![](https://i.imgur.com/daX10nw.png) ![](https://i.imgur.com/1qcjqIG.png) 如果按照教授說的兩次deadline取高的話我們最終排名應如下: | Task | Rank | |:-------------:|:----:| | Seen Course | 3 | | Unseen Course | 1 | | Seen Topic | 1 | | Unseen Topic | 1 | 4. 由於我們這組從Final project一開始時就已經在做了,我們做了非常多資料的分析與嘗試,在Kaggle的上傳次數也是最多,最後才得出這個高分方法,並不是透過分析testing set的資料得來的。在觀看完其他組的報告影片,我們發現有些組別用了跟我們相同或類似的資料後處理方法,也有組別在影片中說明並展示官網可以直接排序熱門課程的評價與購買人數(不用爬蟲)。因此這種資料後處理方法有違規疑慮的話,基於公平性考量,其他有使用相同或類似的資料後處理的組別是否也應該重新上傳Kaggle? 最後再次感謝教授和助教的回信,如果教授、助教對我們組別還有地方有疑問,我們都可以到場說明我們整個競賽的討論過程和內容、包括時間軸、Kaggle提交內容、技巧方法等。因為有在不少平台看到有同學討論我們這組,並對我們的做法有疑慮,所以我們也非常願意對我有疑慮的組別能直接聯絡我們或是和我們當面溝通,在信件結尾處也附上我們每個人的聯絡方式。謝謝助教和教授! 傅立威 r10942078@ntu.edu.tw 陳俊憲 r10246002@ntu.edu.tw 吳政彥 r10522801@ntu.edu.tw 劉智皓 r10941036@ntu.edu.tw