Kaggle Project @deeplab === ###### tags: `kaggle` `deeplab` :::info - **Location:** AtticLab(変更可能性あり) - **Date:** - Week 0 MTG: 10月1日(火) 17:00 ~ - Week 1 MTG: 10月17日(木) 17:00 ~ - Week 2 MTG: 10月??日(O) 00:00 ~ - Week 3 MTG: 10月??日(O) 00:00 ~ - Submission Deadline : 2019年11月7日 <!-- - **Agenda** 1. Walk through signup flow `45min` > [name=Yukai] 2. Sprint planning `45min` 3. Revisit onboarding v1 `20min` - **Participants:** - Yuhsuan (YH) - Arwen (YC) - **Contact:** Max <max@example.com> - **Host:** YK - **Reference:** - [Last week meeting minute](/s/template-meeting-note) --> ::: # Week 0. **Kaggle Competition Project #2** 期間:10/15 ~ 11/7(**コンペ提出締め切り:11/7**) 参加コンペ: [マイナビ × SIGNATE Student Cup 2019: 賃貸物件の家賃予測 次世代を担う学生データサイエンティストの発掘および交流を目的とした学生限定コンペティション!](https://www.kaggle.com/c/ieee-fraud-detection/overview ) Week 1. Visualize and Research ( ~10/17? ) - Visualize班: - `@Takehiko Ohkawa` - `@Tomokazu Saito` - Research班: - `@anno` - `@Daichi Saito` # Week 1. <!-- - [Slide to explain the flow](/p/slide-example) ![Uploading file..._9g7qkojl9]() --> :dart: 1.1 Visualization --- - todo - - 最寄駅追加 - スキーマは[最寄駅,最寄駅からの距離] - 最寄駅の路線名,路線数追加 - - 住所 -> 緯度・経度 - 駐車場に関して - スキーマは[駐車場,駐輪場,バイク置き場] - ある場合は値段,ない場合はnan - angleとmaterialのラベルエンコーディング - - VIFを調べる - 新たな特徴量(オオカワ) - 犯罪率 - スラム - - 風俗変数 - ラブホ変数 - - 平均収入 - 高級住宅街 - 大学/進学校 - 塾 - 教育機関 - 教師数 - - 公園 - 健康施設 - 緑があるか :notebook: 1.2 Research --- ## 重回帰分析ベースのアプローチ - 家賃は正の値をとる離散値なのでポワソン分布か対数正規分布に従うものとするのがよい? - 問題になるのはパラメータを求めるために加味すべき要素がとても多いこと. - 位置による家賃の類似,「駅近」という事実による家賃の類似を加味できるモデル設計を行うことが必要. # Week 2. ``` - データの前処理・特徴抽出 - モデル構築 - 手法の評価 ``` # Week 3. # Note