# 5/22聚會筆記 Project OneDrive: [Link](https://ms1mcuedu-my.sharepoint.com/personal/06546216_ms1_mcu_edu_tw/_layouts/15/onedrive.aspx?id=%2Fpersonal%2F06546216%5Fms1%5Fmcu%5Fedu%5Ftw%2FDocuments%2F%E5%AF%A6%E5%83%B9%E7%99%BB%E9%99%B8&ga=1) # 上週回顧 5/14 聚會筆記: [Link](https://hackmd.io/@Cobra3279/SJ-QqccNc/%2FklRYeUKUQWudWw5Qu7tiyg) 1. House Pricing Project - [ ] 跑 Decanter AI - [ ] AI Canvas 2. Medical Project - [ ] 跑 Decanter AI - [ ] AI Canvas # 預計討論事項 主要目標: 討論初版 AI Canvas 1. House Pricing Project - nan in '都市土地使用分區' - 塞成0, 統一成 label encoding - AI Canvas - 目前大家想的只有價格,但如果是自己要住,會需要其他東西 - 資料部分要考慮:使用者是不是都能取得我們訓練資料的那些欄位?使用者能取得哪些資料? - 生活機能也要考慮: - 犯罪率、公園、交通便利、無障礙設施、政府規劃。 - 產出: 物超所值 - 預測價格: Variance - 價值主張是要寫像是預測價格,還是像是一開始的初衷 - 中英文欄位對照 - 中文名稱、英文名稱、格式(數值、類別、時間、ID) - CSV上面有就要併 - 舊欄位要刪掉 2. Medical Project - The Findings w/ Decanter AI? - 類別型 : - 空值變成另一種類別 - 連續型 : 同時有數值、類別 - 分成兩個欄位(數值、類別) - 數值欄: 1~30 - 類別欄: 有填、拒絕回答、不知道 - Don't know: 7 - never: 8 - refused: 9 - blank : 0 - 例子 - 類別欄:拒絕回答、不知道、blank - 數值欄: 填-1 - 有底線 - 常見: 時間、重量、公尺 - 統一成同一單位 - Others - AI Canvas 3. Grouping or not? - 時間成本考量 4. Resources # House Pricing Project # Medical Project Variable Names: [Link](https://hackmd.io/yERN08jpTEG5O9tTElHmqw) # Grouping or not? - 時間成本考量: 因為每個人都負責兩個專案的話,兩邊的資料都要看,實際上能投入在深度思考的時間會相對較少(相較分組來說)。如果要在 6 月底完成 Project 的話,不確定是否來得及,不過也可以再觀察一個禮拜。 - 或者是我們在任務分配上需要更明確,有重疊的部分,不需要每個人都做? # Resources - [Data Science Code Management](https://shaded-moonstone-935.notion.site/Data-Science-Coding-Management-5a62467a84764234b3769bdb04a6f631)
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up