# PTT 熱門關鍵字 201229 ## 實作步驟 1. 先爬出指定看版的「標題」「內容」「留言」 2. jieba 切詞 3. 只取出內容有出現指定關鍵字(ex. 中國、武漢..)的文章 4. 輸出文字雲 & 詞彙 Counter ## 實作成果 10頁約200篇文章,耗時約2分 ### 政黑板 HatePolitics (10 pages) ![](https://i.imgur.com/E6hcklf.png) ### 八卦板 Gossiping (10 pages) ![](https://i.imgur.com/Vp9z93S.png) ## 改善 1. 關鍵字結果可能要把地名篩選掉 2. 擷取的數量要再更多 ###### tags: `Progress Report`