# 2021伊藤研究 ## スライド https://docs.google.com/presentation/d/1FbS36n5ExLKemMvMAmMpcQ7Y_bajKDXPDSEy4zRTv2E/edit?usp=sharing ~~bcda~~ ## memo ### 0217 - [ ] ハイパーグラフのモジュラリティの定義が本当に適切なのか? - 今利用してるモジュラリティの定義 ![](https://i.imgur.com/eHBQXJA.png) (Kaminskiらの式) - [x] コミュニティの数を変化させたときにモジュラリティが必ず単峰関数にならないか考える←ならない - [x] ある $m$ が存在して,定義域が$[-\infty, m)$で狭義単調減少で$(m, +\infty]$のとき狭義単調増加な関数 - [x] $f(m)$が唯一の大域最小解 - [x] ↑Modularityの場合は逆 - [x] これが示せれば3分探索を用いてコミュニティの数を自動で決定できそう - [x] それか微分をするといい感じに探索できるかも? - [x] 反例が出たので不可能っぽい ![](https://i.imgur.com/RQSIVTu.png) - [ ] AtCoderのクラスタリングではTF-IDFの閾値でクラスタリングを止めたほうが良いかも - [x] 次数分布を見てみる - [x] 論文のリンクを貼る - [ ] BAアルゴリズムについて調べる - [ ] 共著論文,共購買,などの実データ - [x] 実データでいろいろ実験してみる - [ ] 人工データもいろいろなものを作ってみる ## TODO ### 0303 - [ ] [二部グラフクラスタリング手法 新しめ](https://github.com/sjbeckett/weighted-modularity-LPAwbPLUS) - [x] コード見ると LP が線形時間になってない - [x] 二部グラフ用のmodularityを実装する - [x] なぜモジュラリティが突然落ちるのか - [x] わからん - [x] BRIMのみをやる - [x] 速い できそう - [ ] 実データでいろいろ実験してみる - [x] walmart-trip 頂点のラベル無し - [x] LP を速く ### 0310 - [x] 人工データ生成の論文を読む - [x] その実装 ### 0317 - [x] LFRベンチマークによるハイパーグラフ生成 - [x] ないです - [x] その他のクラスタリング系の論文からパクる - [x] 実データでweighted_lp etcを試す ### 0324 - [ ] 日本食以外のクラスタも見る - [x] パラメータ(主にpvals)を変えてmodularityを測る - [x] manh の手法でできたハイパーグラフをクラスタリング - [ ] 生成手法の精査 - LDA などのトピックモデル - unigram mixture - 確率が求まる ### 0331 - [x] Weibull分布パラメータをいろいろ変えて試す - [x] 逆シグモイド関数 - [ ] 声優ネットワーク - [x] 横にずらす - [x] f(x,a,b) = 1/(1+exp(a*x-b)) - [ ] he のサイズの分布を設定できるようにする - [x] 各パラメータにおけるweibullの可視化 - [x] https://hackmd.io/@pGZGik5VQ1CVomDcRq9m-A/rJhoxPmMd#%E3%83%A1%E3%83%A22 ### 0408 - [ ] クラスタ内エッジ クラスタ間エッジの比 - [x] 順位相関 ### 0415 - [x] 今までのRG1のモジュラリティを見る - [x] 実データのモジュラリティを見る - [ ] Label Propagation の論文を読む - [ ] 内積法は Graph コンボリューションに似てる - [ ] アプリオリアルゴリズムが適用できる? - [ ] HE はトランザクション - [x] strictでないModularityを実装する - [ ] strictだけに絞る 人工データはARIだけやる - [ ] KPPSTで利用されていたDBLPデータを使う(Javaで実行) - [ ] error出た:smile: ### 0422 - [ ] コミュニティ構造が顕著な人工データ - [x] Start.java のエラー対処 - [ ] ハイパーグラフを作るデータはPythonファイルだった(Start.javaは関係なかった) - [ ] Cookingの可視化結果 ### 0429 - [x] KPPSTで利用されていたPythonのプログラムを動かす. - [x] KPPSTでmajority,cd最大化のコードを書く - [ ] Cookingの実験 - [ ] 論文の方針を考える ### 0527 - [ ] https://kaken.nii.ac.jp/ja/grant/KAKENHI-PROJECT-25400217/#product_6 から探すと良いかも - [ ] 動的なグラフのスペクトラル的な変化 ### 0603 - [ ] KPPSTを何回かやって最良のものを採用する - [ ] ARIが低い原因を探す - [ ] LS HAなどの実装 - [ ] KPPSTの最新の論文の実装 - [ ] Hypergraph clustering by iterativly reweighted modularity maximaization - [ ] clique展開+次数調整+Louvain法 ### 0617 - [ ] MI,AMIなども調べる - [ ] https://hackmd.io/@pGZGik5VQ1CVomDcRq9m-A/rJhoxPmMd#%E6%80%9D%E3%81%84%E3%81%A4%E3%81%8D%E3%83%A1%E3%83%A2 ### 0624 - [ ] strictでLS,HAを実験する - [ ] LSはKumerの手法後に行う - [ ] モジュラリティの差分更新 - [ ] 次元をいろいろ変えて試す - [ ] 使う手法 - [ ] KPPST 3種 - [ ] Leiden - [ ] 様々な次元で内積重み付け - [ ] HNベクトルにk-meansなど - [ ] データ - [ ] 人工データ - [ ] 今まで論文で使ったもの - [ ] Philipらの手法 - [ ] 実データ - [ ] 指標 - [ ] strict modularity - [ ] majority modularity - [ ] cd modularity - [ ] normal modularity - [ ] bipartite modularity - [ ] ARI (人工のみ) - [ ] [Node2vec](https://github.com/ollin18/Node2Vec.jl) ### 0708 - [ ] WeibullがパラメータによってNaNになる理由 - [x] クラスタリング結果可視化 - [ ] (何回かやって平均を取る) - [ ] SigmoidのデータのLeidenの値が違うので調べる - [ ] 行列分解してベクトル化→Node2vec等との比較 ### 0715 - [x] [Hypergraph Embeddingの論文](https://arxiv.org/pdf/2103.09660.pdf)の実装 - [ ] 得られた精度を吟味する - [x] 複数回クラスタリングした結果のARIを全通り試して平均を取る - [x] 10回分のモジュラリティの違い - [x] 実データによる実験 - [x] sigmoidのb=2とする alphaを1刻み(最大1) - [x] 図を作成する - [x] 次元数変化させてデータ固定 - [ ] パラメータ変化させて次元数固定 - [x] データ x 指標の数だけ作る ### 0722 - [x] 安定性の評価 - [x] エラーバー - [x] K meansまで含める - [x] t-SNEによる可視化 # 0729 - [x] 実験やり直す - [x] 図 - [x] Syn1, sig2個 - [x] ARI - [x] H-MOD - [x] t-sne 提案 - [x] DBLP - [x] H-MOD - [x] t-sne 提案 # 0802 やってることがGCNに近いきがした GCNはNodeのベクトル(年齢や性別など,無いならN2Vで)を畳み込んで # 0812 - [ ] 映画データで実験 - [x] P16の反例を外に大きく出す - [x] 表の色を直す - [x] 表の文字を大きくする - [x] Node2VecやSpecに関して詳しく - [x] KPPSTのモジュラリティの式,アルゴリズム - [ ] GCNについて言及されたら,「今後比較します」という - [x] 行間を開ける # 0822 - [x] 手法の部分が短すぎるので.もっと詳細に書く - [x] P1の2図がどういう関係なのか - [x] 3人での作業がノーマルグラフだと2人の作業が3つあったかのような表現になってしまう - [ ] 本研究では構造同値というより隣接関係を強く表す - [x] 数学的→四則演算や内積のことを表す - [x] 提案手法との関連性 - [x] 提案手法のアイデア - [x] ハイパースフィア上 - [x] 円上にベクトルを並べる - [x] P13のbveを取る - [x] CNAのやつをコピペする - [x] 最終的に4式が並ぶ - [x] P17でもハイパーグラフのクラスタリングの精度で埋め込みを測る - [x] wcd=1に書き直す - [x] degree preservin weight grpah (重みを保持した行列) - [x] P19の横軸縦軸について説明する - [x] 例えば5だと40 - [x] αの違いによってどう変化するかを書く - [x] P24 - [x] キャプションを書く - [x] 色をどう付けたか書く # 0827 - [x] 数学的な扱い→和や内積などの演算 - [x] アニメーションを詳しく - [x] 和で更新→同一方向