###### tags: `final presentation`
# 2022/02/07 Niwa final presentation @L3 and online
### 教員
- 藤川先生
- 新井先生
- 垣内先生
- 遠藤先生
### D3
- Kibrom
- 大平
### D1
- 桂
### M2
- 松永
- 福田
- 丹羽
- 山村
### M1
- 眞田
- 人見
## how to
- 議事録は質疑応答のみでOK.
- 発言者の頭文字を先頭につける.
- f, 藤川先生
- a, 新井先生
- k, 垣内先生
- e, 遠藤先生
- oh, 大平さん
- ... 学生は適当に名字2-3文字で
- f, 例:質問質問
- 発表者の回答は1段下げて記載
- 回答回答
luan先生,yasumoto先生
# 発表者
## Niwa
- yas, 研究室から前でやっている分野の弱点を補う研究、
- yas, 膨大な組み合わせてやってますね
- yas, データ保管をさまざまな方法で試されているが
- y, 訓練データの補完を実験したと思うが,その時の結果のグラフを見せてください
- y, P27,これで思うのが, 結局モデルを学習させるときに
- y, 結局モデルを学習させるときに、
- y, 補完したデータを追加してもモデルの精度が良くならないってことですよね?
- y, 欠損している分も入れるとデータ?が改善されるように感じていたが。
- y, P24グラフを’見ると欠損10%すると悪くなっている。
- y, モデルの学習の際には補完をし内容がいいという
- y, そういう結論になってしまう?
- そういうわけではない, そもそも欠損値補完がされていないと...
- y, このデータからはそうですよね
- この実験は人為的に欠損を増やしている
- 訓練データの欠損率が上がると
- 正しいデータがどんどん減っていくという実験になっている
- 今回,最初は予測モデルの学習の問題を語っていたが、
- 訓練の時も結局連続したデータがないと学習ができない
- 欠損率が上がると正しいデータが無くなって
- 補完したデータがどんどん増えていく。
- y, わかりました
- y, 補完が効いているかどうかを試験するなら
- y, 例えば, 30%の時に改善したかどうかは
- y, 元のデータを30とったやつと比較しないといけない。それをまだやってないということですね
- y, 元のデータから30%ひいたものと
- y, 30%補完したものと比較するようなものを
- y, 検討いただけたらと思います
- 学習データの長さという点では
- y, 提案している3つの手法は
- y, 予測の方をメインにした補完の方法であると思った。
- y, 前の方しか使用してないよね
- y, 学習の意味では後ろの方もあるのでそれを使ったパターン4も検討してほしい
- y, もちろん予測がメインなので妥当かなとは思うけど
- 予測時と訓練時に、別の手法であるのは、問題と考え
- 今回は共通の補間手法をりようしました.
- y, テストの時に, 元々のデータが3.08%の欠損があったということですが,
- y, そこについても補完してやってますか
- そもそも入力ができないので、同じ補完をおこなっている。
- y, この結果では,MAEの上昇が緩やかに見えるが
- y, 大体どれくらいまでなら実用的だと思いますか?
- どれでやっても2分ちょっとの誤差なので
- 実用面であれば、4、5のずれで不満が発生する。
- いしながの手法もにわの手法も
- 大体2分前後ぐらいになっている
- 局所的には10分以上誤差があるところもある
- 調査は、4、5が一回でもあれば不満といった方が多かったので、
- その10分以上の誤差をどれだけ減らせるかが今後の勝負になると思う
- y, MAEの評価でその路線がどれだけ分散があるかでも変わってくると思うが,
- y, 今回の対象とされたデータの分散はどのようになっているのか
- 全体のうちの最も長い区間の走行区間の各便番号毎の各平均と標準偏差
- 各便番号ごとの平均と標準偏差なのですが
- 35分のうち20分はこの区間なので影響が大きい区間
- 標準偏差のバーが一番大きい所で5分以上のブレがある
- 5分以上のずれがあり、
- この路線では6-10便目がピーク
- 6〜10便目がピークだが,そこが
- 誤差が大きい路線になっている
- y, 変動のあるものでも効くということですね
- y, 欠損があっても予測ができるって言うことは大きな貢献かと思いました.
- y, 2便先とか3便先とかもあったが,
- y, 石長らの手法では2運行先とかも予測出来るものだったのでしょうか
- 元々そうなっている。
- a, 訓練のときに、
- a, 欠損がない状態でも十分な学習データがあれば
- a, 欠損のない連続データも評価してもよかったと思うが、そのような結果はあるのか?
- P45で訓練データの中で最も長いデータは200運行が1サンプルだけ
- 200運行は8日分に満たない
- 1週間のデータすら取るのが難しい
- 欠損がまばらに散らばっている
- 連続して、データが取れるところは、一日でも難しい。
- 欠損値を補完していないところで学習するのは少し難しいと思っている
- y, データの補完はバスだけじゃなくて
- y, いろんな分野で必要とされているが
- y, 今回の知見をバスへの応用はできると考えいるのか?
- y, どんな時系列でもいけますとか
- 今回はバスの自己相関を見て,
- 1日時ことに周期性があるから
- そこに着目した評価手法となっている
- 他の分野だとそのデータにどういった特徴があるかによって変わるかなと
- 今回の僕の研究も含めて
- 特徴に合わせた欠損値補完
- その分野ごとにデータを分析したほうが良いのではないかと思います.
- y, ぜひ他の分野でも応用できればと思いました
-
- a
## 発表者2