--- title: 9.jieba套件的原理與安裝方法 tags: Python 進階語法與應用, 筆記 --- ## 9.jieba套件的原理與安裝方法 計算字次數:無用 計算字詞次數:有用 分詞:把詞分開 我|中午|吃|牛排 ### 語言處理:教電腦讀懂意思.Siri, Google Assistant) -教電腦: 重點是什麼,重點分數 1. Tf 數次數,越多, 分數高 2. idf 慣用修正 搜集很多文章 詞在越多文章出現 是慣用詞彙 越不是重點 分數越低 #### 數次數*慣用修正=完整分數 分數越高 越是文章重點 tf-idf方法 ### 函式庫 jieba 1. 分詞 2. 數次數 3. 慣用係數 4. 算出總分 簡繁轉換沒問題 有問題是慣用語不同 如:北農 台灣常用 中國不常用的詞彙有問題 --- * [GitHub - fxsjy/jieba: 结巴中文分词](https://github.com/fxsjy/jieba)
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up