# DGMCの概要とチューニングに向けて ### DGMCの概要  与えられたグラフ$G_{s} = (V_{s}, A_{s}, X_{s}, E_{s})$(Vはノード集合、Aは隣接行列、Xはノード特徴量、Eはエッジ特徴量)を入力として、ターゲットとなる$G_{t} = (V_{t}, A_{s}, X_{s}, E_{s})$の各ノードを見た時に、$V_{t}$の各ノードが$V_{s}$のどのノードと(種類が)一致するのかを判定し、一致行列と呼ばれる$S$を求める。 DGMCのアルゴリズムは2つのステージで構成されていて、ステージ1ではグラフニューラルネットのメッセージ伝達によって、$G_{s}$および$G_{t}$のそれぞれのノードに関する特徴を、集約関数によって集約する。その後、Local Feature Matchingなるもので一致行列Sを獲得する。メッセージ伝達はSplineCNNを用いて行い、その後のマッチングは擬似的な接続行列の演算(擬似的なグラフラプラシアンの計算)によって、値の一致するノードをマッチングさせる。  ステージ2では、集約した特徴量に応じて、あらかじめ色付け(カテゴリ分け)された$G_{s}$のノードと一致する$G_{t}$のノードを判定する。 ### チューニングの方針に関して  SplineCNNの特徴抽出に関しては、脳領域の接続の距離(ホップ数)をどこまで考慮するか、という問題がある。SplineCNNを5層準備した場合は、グラフの5ホップ先の情報までが集約される、というイメージを簡単に持っておくと、脳領域を網羅するほどに層を積むか、近隣の情報(ホップ数1~2程度)に絞っておくか、ということが調整する一つの問題となる。 次に、同じく脳領域特有のデータ特性を理解して、グラフ全体を入力するのではなく、部分グラフに分割してデータにするという案もある。グラフ全体ではノードのカテゴリ数が非常に多いので、マッチングアルゴリズムでの問題想定(せいぜい数十カテゴリの分類問題)とは趣旨が異なっている可能性がある。とはいえ、データの加工基準などを考えるのは難しく、部分グラフへの分割はそれなりに苦労する工程とも考えられる。