###### tags: `作業-進階` `大一程設` `東華大學` `東華大學資管系` `基本程式概念` `資管經驗分享` HW3-2 === ## Description 今天你手邊有一份資料,是一份文章,請點以下連結下載,並請把文章複製到 txt 檔案內。 <a href="http://www.elearn.ndhu.edu.tw/moodle/file.php/91280/content.txt" download="content.txt">content.txt</a> 文章節錄自 [The Founding of Apple Computers, Inc.](https://guides.loc.gov/this-month-in-business-history/april/apple-computers-founded) 今天我們想知道上面這份文章內,`Apple` 這個詞以及 `Steve Jobs` 這組詞總共出現多少次,請你利用第六章及第八章字串所學的工具完成此題。 經過程式幫我們計算,這份文件含有 588 個字。 > 先前測錯,在此更正 * 請求出以下資訊 : * 本文的總字數 * `world.`、`(which`、`company)` 這種類型會被算成一個字 * `Apple` 以及 `Steve Jobs` 這兩組詞個別出現的總次數 * `Apple` 以及 `Steve Jobs` 這兩組詞個別的 Term Frequency ```javascript= 詞頻是說一個字或一組詞在一份文章內出現的比率, 假設在一篇共有 100 個字的文章中,banana 出現 30 次, 就會說 banana 的 tf 為 30/100。 ``` > 如果你想更了解詞頻,歡迎挑戰這篇文章,雖然是高年級甚至是碩士生才會碰的東西 > [[文件探勘] TF-IDF 演算法:快速計算單字與文章的關聯](https://taweihuang.hpd.io/2017/03/01/tfidf/) > [name=Orange] ## Constraint * 檔案開啟的路徑一律統一,請繳交答案時確定路徑如下 * `in.open("content.txt")` ## Sample Input and Output ![](https://i.imgur.com/f2YH5tb.png)