# 2019/07/20 ## 概要 - 主に人を募集中という話,研究者,エンジニア,共同研究,社会人ドクターなんでもこい - 技術的には今までのKDDとかの内容を軽く説明 - ポイントは,時系列のダイナミクスを微分方程式でモデル化する点 - 複数のダイナミクスを切り替える点 - 切り替えるポイントを推定したり,切り替えのダイナミクスのネットワークが要因ネットワークであると言えたり - DLは基本的に使ってない. - 微分方程式とかでモデル化が背景になっていて,それの組み合わせ先がテンソル分解だったり,射影(重回帰)だったり,色々あるって感じ. - 一般向け & 人募集中 色が期待より強めだった. 若手研究者,技術者のためのAI,ビックデータ解析セミナー 櫻井先生 松原先生 [特設ページ](http://www.dm.sanken.osaka-u.ac.jp/~yasuko/TALKS/JP_19_Seminar0720/) NTT,大規模データの検索 CMU データストリームの高速パターン検出 時系列ビックデータ解析 時間発展をリアルタイムに予測. 一般的にはWebの研究が多い(アメリカの影響). でも日本ではIoTも結構必要なのでは トヨタ自動車との共同研究 人が死ぬとか死なないとかをわける技術が情報 研究者で閉じこもっていても意味ないので,企業と共同研究をやっている. 予測,要因分析をリアルタイムにやる. 事故とかトラブルのサインを見つける,予知する技術を開発している. 病気的にも同じ.データ解析としては同じ 社会人ドクターもあるよ 松原先生の業績を褒め称えるフェイズ KDD, SIGMOD, WWWに通すのは大変だけど9本も通している チュートリアルもやったよ 通してても流行でコロコロテーマを変えているとその道の専門家にはなれない. 時系列データにこだわっていたので,日本人初の採択 KDD best research paper awardも初めて すごい業績アピーがが激しめ 共同研究色々やっている トヨタ自動車,ジェイテクト 富士通研,ソニーなどなど 30分経過も本編が始まらない 共同研究の申し込みはたくさんあるけど,エンジニアも研究者も不足していて受けられない 人が来てくれないから阪大に移った. いま人を募集中 # こっから本編 非線形テンソル解析とリアルタイム予測 KDD * 3 + SIGMOD + WWW 大規模テンソル解析 テーブルデータ的なものがある. KDD 2012 TriMine 主成分とかトピックを抽出 ユーザーとトピックとの関係とか,時刻とトピックとの関係(月曜にビジネスが増えるとか)が見える. ミクロな情報だけ見ていてもだめ.何が大事かというと,関連するユーザー,関連するattributeだけを足し合わせることが大事. テンソル分解のとき,ギブスサンプリングを使う!! これはテンソルがスパースであるため.数字があるところだけ学習したい. 初めはトピックを適当に決める.initialize スミスはだんだんトピック1ぽいとかがわかってくる スミスはトピック1が高いうえでの重み付きのランダムサンプリング 多次元時系列シーケンスの予測問題 それぞれのシーケンスに対して独立に予測するのは無理.たまにしか1にならない. TriMine-F テンソル分解,時間行列だけを予測(トレンド的な),テンソル分解の残りの要素と掛け算して予測. トレンドは周期性があったりするので,まだ予測できる. SOTAではあったけど,実用としては厳しかった 今年度は材料が整いつつあるので,これをやる予定 KDD 2014 FUNNEL 一瞬で終わってしまった ## 非線形モデリング 非線形の微分方程式を使って時系列予測をモデリングしたい. 遅いとだめなので,それを速くしたい. SpikeM KDD 2012 webがあってフォローフォロワーの関係があるとき 非線形の方程式で,情報の感染を予測する. イベントの影響力の強さと減衰で予測. 7つのパラメータで構成される非線形方程式でモデリング. これを使って時系列予測. googleの検索回数のダイナミクスを予測. WWW 2015 非線形モデリング 微分方程使って何ができるかを考えていた. ジャングルの生態系 fruitsを食べる競争をする2種類の猿 同じような関係がwebにもある. XBOX,PS4, vitaなどなどでどれがライバルなのかを考える. webのキーワードたちは検索資源を消費しって,注目度を上げるというジャングル的なダイナミクスがある. 季節性もある(クリスマスとか). なので,生物もモデルが使えるのではないかと考えた. - non-linear dynamics 各キーワードの増減 - interaction between multiple keyword 競合関係 - seasonality 独立成分分析を使って複数の季節性 3つのパラメータを,ほかをfixして1つを更新していく. ## 特徴自動抽出 SIGMOD 2014 AutoPlait chiken danceを入力するだけで,4つのパターンがあるということを抽出する. 教師なし時系列セグメンテーション コンセプトは符号理論 モデルの表現コスト モデルの数を増やすと変数の数が増えるが,モデルとデータとの誤差が下がっていく. 徐々にモデルの数を増やしながら誤差がどう変わっていくのかを見る. splitと言っているが,どういうふうにsplitの場所を選ぶのか.ほかはfixなのか 計算量が少ない. 関数は2つ.splitと誤差計算のみ たぶんsplitを再帰で回しているということ cut point scan なんかDPをやっているっぽい 一回しかでてこない動作があっても検知可能である. つまり,異常検知もできる ゲームの例がたくさんでてくるのは松原先生が好きだから アサシンクリードが好きだったらしい この手法はトヨタと共同研究にも使った WWW 2016 CompCube 非線形テンソル解析 KindleとNexusの競合関係,localに見える. 国によって競合関係が異なる iPodの季節性 クリスマスにipodが売れるところ,chinese new yearに売れるところがある. ***基本的に季節性のモデルの最適化と,競合性みたいな時間関係ない特徴のモデルの最適化を繰り返し行っている感じ** # リアルタイム将来予測 RegimeCast 車のセンサデータから理想のドライビングを予測する研究 突発的なパターンにもリアルタイムに対応,予測.(モデルを切り替える) レジームシフト walkingからwiping 時系列パターンをレジームとして表現する 非線形ダイナミクス 潜在的なactivityのダイナミクスと,そこからでてくるイベントというモデル化. 重回帰っぽい定式化,射影.潜在的なイベントは少ない (わかる) ある程度の雛形を用意しておいて,それを使って,潜在的なactivityをモデル化する. モデルをスイッチする. 混合重回帰っぽい感じか? 多重構造 低周波成分と高周波成分にわけて,ばらばらにモデリングする. モデルを作ってデータベースに登録. 現在のものにあうものを検索 ないモデルは,都度学習する # これからの研究 ## IoTのための複合ビックデータ予測 速度加速度だけでなく,ウィンカーとかもみたいな離散値 DLは連続値の予測精度が悪い 非線形の微分方程式を使うと綺麗に予測できる. 離散値でデータを特徴量空間に落とすことが大事 これをやると,空間微分として扱える. イメージとしては熱力学の方程式を使いたい 工場のアラームの熱源のダイナミクス ドクターの学生は松原先生が作った技術を使う方で研究してもらっている. ## リアルタイム要因解析 動的因果ネットワークの自動生成 walking ストレッチなどの状態遷移をグラフとしてモデル化. このパターンがでるときは,このパターンから遷移するので,これが要因的な話 動的因果ネットワーク これは今回のKDD ネットワークがあることで長期の予測もできる. 今困っているのは,エンジニアがいたら,今の予測は理論ほどは性能が出てない気がする. ここからさらに製品化へ向けて,ソフトウェアやアルゴリズムを見なおしてくれる人がほしい. OrbitMap KDD2019 regime (1つのアクティビティ) regime間の遷移をモデル化している.隠れマルコフとかと違うのは,regimeの中のある一点(場所)に来たら遷移するというモデル化.確率で同じregimeの中でどこからでも飛ぶわけではない. ブラックホール,ホワイトホールみたいな関係になっている. DLは判別問題には無類の強さ. ただ,時系列のコンセプトをうまく表せていない. リアルタイム予測では最高の精度と最高の速度を出していきたい. DL以外では時系列予測はでてない. 統計だとあるけど,リアルタイム性は全然考えてない. データマイニングでは予測の技術はある.(DLを使って論文を書きたいから,DLは論文が通るから) 実世界で使える予測技術を作っている人はほとんどいない. ドクターの人は,最初は論文がでるやつをやって,徐々にチャレンジングにしていけばいいのではないか. BRAID SIGMOD 2005 橋梁モニタリングと異常検知 トヨタのデータ テンソル分解して解析 運転のデータから,どこでだれがどんなふうに運転するか.どんなグループがいるか.ちょっと変な運転をする人がいれば,介入するとかが可能にある.(これは3年前) 現在何をやっているかというと,理想の運転行動をシミュレートするものを作っている. 事故だけではなく,燃費的な理想とかもやっている.見たとこ勝負の自動運転ではそういうことができない. 自動運転コンペティションみたいなおもちゃみたいな技術ではなく,ちゃんとやっていく. # 会社作った 研究室で基礎技術を作った時に,それをソフトウェアとしていろんな会社に提供する会社. 開発,調整,保守,マニュアルなどなどをやっていく会社 今回のはこれ目的も結構ありそう. いろんな会社から声をかけてもらっている. 阪大のベンチャー支援制度 (この会社を畳んでもう一個別の会社を作れと言われている.) マネージャ,経営者も募集中! 基礎研究部門は大学がやるというメリットもあるよ!! # 産業科学AIセンター 阪大でできたやつ. 産業科学研究所自体は古い. センター長やってくれって言われていたけど,やってられないので副センター長にしてもらった 異分野と連携したい.デバイス開発のための研究とか いろんな実験条件があって,この結果がでてきた. そういうシミュレーションをサンプリングしてたら,こういう実験条件でやってみるといいよとサジェスチョンしてほしい. パワエレ関係の接合界面のサジェスチョン? もうひとつは人材育成 新しいAIを作っていける人を育てていきたい. 社会人ドクターも受け入れたい Christos Faloutsosへ海外派遣もオッケー (トップカンファレンスに通ってからなら) 松原先生が情報の分野でトップ(N回目) 人募集中 (N回目) 部屋もいい感じで,アーロンチェアもあるよ スタンフォードの椅子がアーロンチェアだった. 世界トップの研究室にするなら椅子も同じにしないと 8月に助教とかの公募はある. 学振100%とってる(やば) むりくり学会で賞とかとらないといけない. お金は研究室で払うので,2年生とかから取ればいいよというスタンス 研究レベルの向上 1. まずはテーマを与えて,これをやったらトップ会議というお膳立てをして, 2. 詳細だけ考えてもらう 3. 新しい技術を生み出す実力を身につける 4. 自立した研究者になる (自分でコラボレーターを見つけて研究する) 博士課程いいよ 夢と技術と貢献 在籍しながら社会人ドクターは時間がない. 世界を目指すなら会社やめるぐらいの度胸を