# はじめてのコンペ ### 初心者が、評価データを提出するまで --- # まず、 # コンペとは? --- ## 企業が ## 競争形式(コンペ)で ## 課題を提示 --- ## 賞金と引き換えに ## 精度高い機械学習モデルを ## 投稿してもらうもの --- #### 最も有名なプラットフォームは「[kaggle](https://www.kaggle.com/)」 ![](https://i.imgur.com/Cd2a6go.png) --- #### 今回は、 #### 日本版kaggleの「[SIGNATE](https://signate.jp/)」 ![](https://i.imgur.com/acoourC.png) --- #### お題は、 ##### 「The 3rd Tellus Satellite Challenge:海氷領域の検知」 ![](https://i.imgur.com/FY4GGPY.jpg) --- ### Tellus(テルース)? --- #### [Tellus](https://www.tellusxdp.com/ja/) : 衛星データのオープンソース活用を推進するプラットフォーム ![](https://i.imgur.com/3dFqaB9.png) --- #### 衛星で、なにする? --- #### 衛星写真から海面上の氷を検出 ![](https://i.imgur.com/9Wigwu6.png) --- #### なるほど。 --- ### どうすれば?? ![](https://i.imgur.com/SWtoMxb.png) --- ##### セマンティック・セグメンテーション ###### 特定の範囲を検出する事 ![](https://i.imgur.com/6SRiOYT.jpg) ![](https://i.imgur.com/P0m1sqW.png) --- #### [U-Net](https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/)というモデルが有名そう ![](https://i.imgur.com/oHcdQe7.png) --- # よくわからないけど # とりあえず実装 # してみよう --- #### ここで、様々な挫折 * 開発環境構築しなきゃ。 * そもそもpythonの基礎知識が無い。 * 画像の扱い方がよくわからん。 * 評価データの作り方の説明ない。 * 動いたか?いや、結果が真っ白。 * GPUが無くて、学習が遅い。 * GoogleColaboratoryに移植。 * GoogleColaboratoryの制限に苦しむ。 --- #### 色々と苦労しながらも #### なんとか評価データを作り #### 提出。 --- #### ほっ。 ![](https://i.imgur.com/dKVhYyb.png) --- #### 提出までの超概要 * SIGNATEからデータダウンロード * 訓練用画像の前処理 * 2種類(偏光)の画像を1つにマージ * アノテーションデータの加工(シンプルに) * 画像のサイズを統一 * 正規化(0~1の数値に変換) * U-Netモデルの定義と読み込み * 学習 * テストデータをモデルに渡して結果を出力 * 結果から評価データ(json)に変換 * 提出 --- ###### 予測画像はこんな感じです。 ![](https://i.imgur.com/x9wjXFn.png) ![](https://i.imgur.com/xfzk8qJ.png) --- #### ここからは #### 試行錯誤 --- ##### 試行錯誤(FirstSubmit) ![](https://i.imgur.com/7uoT4qH.png) --- ##### 試行錯誤(高画素化/エポック増やし) ![](https://i.imgur.com/9Qm8tEH.png) --- ##### 試行錯誤(画像分割) ![](https://i.imgur.com/9NQbCpk.png) --- ##### 試行錯誤(画像3層化) ![](https://i.imgur.com/MQ7XouG.png) --- ##### 試行錯誤(画像水増し) ![](https://i.imgur.com/PKwzzMA.png) --- ##### 試行錯誤(過学習調整(INPUT少なく)) ![](https://i.imgur.com/IrhE1Vu.png) --- ##### 試行錯誤(過学習調整(フィルター少なく)) ![](https://i.imgur.com/OlEBfFo.png) --- ##### 結果まとめ | # | 調整事項 | 評価値 | | -------- | -------- | -------- | | 1 |FirstSubmit | 0.61243 | | 2 |高画素 | 0.70813 | | 3 |画像分割 | 0.68968 | | 4 |画像3層化 | 0.70633 | | 5 |画像水増し | 0.69089 | | 6 |過学習調整(INPUT少なく) | 0.71899 | | 7 |過学習調整(フィルター少なく) | 0.72365 | --- #### 今後試したいこと * 回転角度をランダムにする * ズームでの水増し * アノテーションデータの多層化 (今は陸/海/氷のみ) * U-Net以外のモデル * ・・・・・・・・・アイデア下さい --- #### みなさんも是非。
{}
    424 views