# 帳號分群 3/18 實驗結果 ## 新增 hash function 嘗試增加不同的 hash value 作為 feature,期許能讓Kmeans分群能夠更準確。 ### 將文字拆成一半將前半與後半各自產生一個 hash value ``` ex: 12345678 first half values = 1+2+3+4 second half values = 5+6+7+8 會遇到的問題 ex: 43218765 hash完的結果會跟上例相同 ``` 使用資料(100筆,純數字) - 純數字帳號還是無法在 Kmeans 階段分的更準確 - [2 group](https://docs.google.com/spreadsheets/d/1i2x7VwKJtBDx2wEODaj2uT98CIg_6XM3RdAO0EPVdK8/edit?usp=sharing)  - [6 group](https://docs.google.com/spreadsheets/d/1zq2bM0O8dmwmW0dfsla9MJE1ESW0TbCjRhv9LwrTK54/edit?usp=sharing)  可以觀察到即使新增這兩種hash value 作為 feature,帳號間還是缺少獨特性,因此群心數即使只有 2 ,依然會有被拆散的可能 ### 新增將奇數、偶數位 concat 起來做為 hash value ``` ex: 12345678 odd values = 1357 even values = 2468 如遇到 ex: 43218765 odd values = 4286 even values = 3175 可有效的做區分 ``` 使用資料(100筆,純數字) - 此方法會讓文字所在字串中的順序變得更重要,猜測應該能更有效提升數字分群的準確率 - [6 group](https://docs.google.com/spreadsheets/d/1HJ987ianesWzm7A0nuFKnYkvsZEJbXhKGQuRWw_6UM0/edit?usp=sharing)  - [10 group](https://docs.google.com/spreadsheets/d/1cMMyHCL6A1sBcxas-HwZFj2OSFX3s7SeE70BK3MJYeA/edit?usp=sharing)  可以觀察到,即使將群心數增大,相似的帳號也能正常地分在一起了,不會被拆散 --- ## 開頭相似、中間相似、結尾相似資料測試 - 測試資料 ``` ty248051 AccClone024 ty257673 AccClone030 ty317446 AccClone032 ty331606 AccClone035 ty339001 865166029011122 865166022056090 865166022200862 865166023432043 213005071314215 213005071404451 213005062852070 213005072123016 12037783Gold 9981MIDDLE0310 12007043Gold 2341MIDDLE9324 12309943Gold 6721MIDDLE3679 ``` ### Kmeans clustering - [2 group](https://docs.google.com/spreadsheets/d/1yd9A_ahT0vTUJPs5bkRAyorYsW8rNpzvI_J3lRakg-k/edit?usp=sharing)  - [6 group](https://docs.google.com/spreadsheets/d/1gkXESyW5ACWZj3Lf1xiiO4lAP8noeh3ApiHphPMhLYo/edit?usp=sharing)  - [10 group](https://docs.google.com/spreadsheets/d/121GK2GKT7U_rnf9eh7UXjxJ0ED1x6BoUNKVKAaWJkmw/edit?usp=sharing)  ### Hierachical clustering 1 group  #### threshold 5 - 群組成員數量清單  - 成員所在群組清單  #### threshold 13 - 群組成員數量清單  - 成員所在群組清單  #### threshold 20 - 群組成員數量清單  - 成員所在群組清單 
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up