# 3.6 Notes Association rules 的用途像是: - 非常適合用在很多的 ++data mining++ applications - 推薦我們書、電影、音樂的網站 :::info 在 14 章裡面我們會看到要如何去把 association rules genralize 成 concepts,而且這些 concepts 不一定要是 binary 的, association 的 types 也可以不同,並且我們也可以加入 hidden variables。 ::: ++Recommendation systems++ 已經很快的變成了 ML 的其中一個主要應用領域,很多零售商對用過去的 data 預測消費者的行為很感興趣。 我們可以藉由用++矩陣++呈現來 visualize 我們的 data,其中: - row 是顧客 - column 是 items - 裡面的 entries 可能是買的數量,或是消費者對這個商品的評價 :::warning 通常這個矩陣會超級大,但也非常 ++sparse++,而且 ++rank 也會非常小++。 ::: Q:為什麼這個矩陣會非常 sparse? $\rightarrow$ 因為在一家店裡這麼多的商品裡面,每個人通常只會買其中幾樣。 Q:為什麼 rank 會非常小呢? $\rightarrow$ 因為在我們的 data 中有很高的 dependency,人們在買東西的時候不是隨機的。 舉例來說,家裡有小嬰兒的人通常會買類似的東西,特定的商品也常常會一起買,或是絕對不會一起買。 因為有這樣的 regularities,而且我們的 hidden factors 數目又小,所以我們的 rank 才會小。 > 更詳細的一點說,當顧客中有很多買相同或相似的東西時,代表有很多列是相同或差不多的,因此我們可以透過列運算去相消,這樣一來 rank 當然會下降。 :::info 第 6 章會講 dimensionality reduction,也就會提到如何從 data 中 extract 這樣的 hidden factors 或 dependencies。 :::
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up