tags: 作業-進階 大一程設 東華大學 東華大學資管系 基本程式概念 資管經驗分享

HW3-2

Description

今天你手邊有一份資料,是一份文章,請點以下連結下載,並請把文章複製到 txt 檔案內。
content.txt

文章節錄自 The Founding of Apple Computers, Inc.

今天我們想知道上面這份文章內,Apple 這個詞以及 Steve Jobs 這組詞總共出現多少次,請你利用第六章及第八章字串所學的工具完成此題。

經過程式幫我們計算,這份文件含有 588 個字。

先前測錯,在此更正

  • 請求出以下資訊 :
    • 本文的總字數
      • world.(whichcompany) 這種類型會被算成一個字
    • Apple 以及 Steve Jobs 這兩組詞個別出現的總次數
    • Apple 以及 Steve Jobs 這兩組詞個別的 Term Frequency
詞頻是說一個字或一組詞在一份文章內出現的比率, 假設在一篇共有 100 個字的文章中,banana 出現 30 次, 就會說 banana 的 tf 為 30/100

如果你想更了解詞頻,歡迎挑戰這篇文章,雖然是高年級甚至是碩士生才會碰的東西
[文件探勘] TF-IDF 演算法:快速計算單字與文章的關聯
Orange

Constraint

  • 檔案開啟的路徑一律統一,請繳交答案時確定路徑如下
    • in.open("content.txt")

Sample Input and Output

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →