# Ch08 rough set 學習筆記 > Student_name: 林璟辰 > Student_number: 1073301 - Content [ToC] ### Step 1: 粗糙集 - 粗糙集作為一種處理不精確、不確定與不完全數據的數學理論,最初是由波蘭數學家 Pawlak於1982年提出的,其主要思想是利用已知的不完全信息或知識去近似刻畫不精確或不確定的概念,或者依據觀察、度量到的結果去處理不分明的現象和問題。從數學角度來看,粗糙集理論不像大多數現代數學理論那樣具有高度的複雜性和抽象性,掌握此理論也不需要過多的現代數學方面的預備知識。但是簡單易行正是粗糙集理論的優點,在許多實際問題中,這一理論所涉及的數學工具已經足以完成表示和挖掘知識的任務。經過三十多年的不懈研究,粗糙集在理論上不斷完善,在應用上廣泛擴展,目前已經在信息系統分析、機器學習與知識發現、數據挖掘、決策支持系統、過程控制、故障檢測、模式識別等方面取得了成功的應用。 原文網址:https://kknews.cc/zh-tw/tech/2yekjar.html ### Step 2: 決策表 - 如果將屬性集合A分為條件屬性集C和決策屬性集D,資訊系統則稱為決策表,可記為: S=(U, R, V, f) - 當資訊表中,屬性集A分成條件屬性和決策屬性兩個互相沒有交集的屬性集時,資訊系統便成為決策系統,表中每個個體就對應著一條決策規則。資訊系統中結論屬性集D中的一個取值就對應為系統中的一個概念。 ### Step 3: 粗糙集的化簡 - 粗糙集系統中的屬性並不是完全一樣重要的,有些是多餘的。屬性化簡就是在保持系統分類能力不變的條件下,刪除那些不相關或者不重要的屬性。化簡反映了一個資訊系統的本質資訊。屬性化簡也稱知識化簡或知識約簡。 - (1)求出決策表中的重複物件 - (2)求屬性化簡集的核 - (3)計算化簡集 - (4)確定最佳化簡集 - (5)生成決策規則 ## Step 4: 屬性重要性度量 - 決策表中不同的屬性和屬性集的重要性是不一樣的,有些屬性對決策結果有著主導作用,處於支配地位,而有些作用卻很有限。因此,屬性重要性在化簡計算中可作為啟發式規則來克服常規化簡演算法的NP-難問題。 - 判斷屬性重要性的基本想法是根據該屬性對分類結果的影響,若去掉該屬性對分類影響大,則說明該屬性的重要性高;反之,說明該屬性的重要性低。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up