# ジオストリムに関する既存研究 - 作成日:2019年05月24日 - GeoStreams: A Survey(TOBIAS BRANDT and MARCO GRAWUNDER, University of Oldenburg,Published by ACM 2018) ###### tags: `ジオストリム` `まとめ` `既存研究` 1. **応用** <br> * **Road traffic management** <br> | データ種類 | 範囲 | 主題 | | ------ | ------ | ------ | | 静止点 | 個別車両 | Özal et al.(2011)(最善のルートを選択するために道路ごとの現在の平均速度を計算) <br> Wakamiya et al. (2014)(個々の自転車ルートを改善するためにTwitterメッセージを使って混雑したスペースを検出する) <br>Zhu et al. (2015) (ストリーミングデータのナンバープレート認識に基づく移動仲間の検出)| | 軌跡 | グローバル(e.g 都市) | Geisler et al. (2010) (車に警告するために高速道路の列の終わりを検出する) <br>Chen et al. (2013) (タクシー交通データの異常;部分的な軌跡でもオンラインで動作する) <br>Tao et al. (2012) (携帯電話のGPSデータを用いた交通量のリアルタイム推定) <br>Tseng et al. (2014) (GPSデータストリームを用いたTwitter Stormによるオンラインおよびリアルタイムの交通状況推定) | | 軌跡 |個別車両|Ali et al. (2010) (最良のバスシャトルピックアップの場所を計算する) <br>Basalamah et al. (2012) (ビジョン、悪い運転習慣を検出するための軌跡の使い方) <br> Chen et al. (2013) (タクシー詐欺/異常検出;部分的な軌跡でもオンラインで動作する)<br>Yang et al. (2014c) (道路状況がリアルタイムで変化する動的ネットワーク内の車両の最善ルート) | | |全般|Guo et al. (2014) (ストリーミングデータを含むトラフィックデータの将来の利用に対するビジョン) <br>Maarala et al. (2015) (リアルタイムおよびバッチ処理のためのトラフィックデータストリーム解析のためのApache Sparkベースのアーキテクチャ) <br>Amini et al. (2017) (リアルタイムおよびバッチ処理用のトラフィックデータストリームのアーキテクチャ) | * **Flight and Vessel Monitoring** <br> | 目標 |主題 | | ------ |------ | | 異常検出 | Laxhammar (2008) (グリッドセルにおけるGaussian Mixture Model(GMM)) <br> Gariel et al. (2011) (クラスタリングを使って) <br>Pallotta et al. (2013b) (学習した行動に基づく予想経路からの逸脱)| | 予測| Gong and McNally (2004) (アルゴリズムの予測精度を比較するためのフレームワーク、ストリームベースの予測のベンチマークのために使用することができる) <br>Bomberger et al. (2006) (グリッドベースの離散化と人工ニューラルネットワーク(ANN)) <br>Pallotta et al. (2013b) (以前の船舶の行動に基づく) | | クラスタリング|Laxhammar (2008) (異常検出用) <br>Gariel et al. (2011) (k-meansとDBSCANを使ったウェイポイントと異常の検出) <br> Vespe et al. (2012) (インクリメンタルk-meansを使ったウェイポイント検出(TPアルゴリズム)) | | ウェイポイント検出|Gariel et al. (2011) (クラスタリングを使って)<br>Vespe et al. (2012) (クラスタリングを使って検出された典型的なウェイポイント) <br>Patroumpas et al. (2017) (AISデータをウェイポイントに縮小してデータを圧縮する)| | 一般モニタリング|Schüller et al. (2010) (航空交通監視) <br>Schüller et al. (2011) (航空交通監視の可視化のためのキャッシング) <br> Patroumpas et al. (2017) (AISデータストリーム内の不正行為などの複雑なイベントの検出) | * **Monitoring Environmental Phenomena** <br> | 現象の表現|主題 | | ------ |------ | | 連続現象 | Dereszynski and Dietterich (2011) (動的ベイジアンネットワークを使用した品質管理)<br> Galarus and Angryk (2013) (同様のセンサーを見つけることによってロバストな近傍を作成する) <br>Whittier et al. (2013) (データストリーム中のセンサー間の値の補間) <br> Liang et al. (2016) (フィールドデータ型で連続現象を表す)| | 進化している分野| Huang and Zhang (2008) (異なるオブジェクトタイプを持つデータストリームの管理) <br>Junghans and Gertz (2010) (進化する領域の動きの予測) | * **Social Media and Location-Based Services** <br> | 目標 |主題 | | ------ |------ | | ソーシャルデータマイニング | Hwang et al. (2013) (インフルエンザリスク分析にTwitterストリームを使用) <br> Pham et al. (2013) (軌跡データを用いたソーシャルネットワークの検出) <br> Abdelhaq and Gertz (2014) (ローカルトピックを検出するためにTwitterストリームを使用)| | citizen科学| Aberer et al. (2010) (大気質センシングのためのオープンネットワーク) | | 推薦システム|Pu et al. (2012) (暗黙のユーザ入力を使用) <br>Zheng et al. (2012) (軌跡に基づいて面白い活動を推薦する;オンライン学習は将来の仕事に限る) <br> Rathinavel et al. (2014) (モバイル位置情報に基づく推奨システム)<br>Bao et al. (2015) (位置情報推薦システム調査)| | モード分類|Zheng et al. (2008) (軌跡データを用いて運動モード(バス、車、歩行者)を予測する、オフライン学習、オンライン分類)| | プライバシー|Chow and Mokbel (2007) (連続クエリでは、ロケーションとクエリのプライバシーを区別する) <br>Dewri et al. (2010) (継続的なLBSのプライバシー) <br> Assam et al. (2012) (ユーザーのプライバシーを保護するためにノイズを追加する) <br> Nussbaum et al. (2012) (推論攻撃および解決策に対するk-匿名性の弱点) | 2. **Geostream Management Systems** | アプローチ | 範囲 | 主題 | | ------ | ------ | ------ | | 専用または新規DSMS | ー |Eom et al. (2015) (CQLとGeoSPARQL、インデックスとクエリプロセッサを統合したクエリ言語)| | DSMSの拡張 | 全般 | Mokbel and Aref (2008) (ストリーミングシステム内でオブジェクトや領域を移動するためのインメモリ結合演算子) <br>Whittier et al. (2013) (温度などの連続現象に関するセンサネットワークからのデータを処理する) <br>Whittier et al. (2014) (連続データを含むフィールドについて述語) | | DSMSの拡張 |特定のシステム|Patroumpas et al. (2008) (時空間問い合わせのための“ TelegraphCQ”の拡張) <br> Ali et al. (2010) (Microsoft StreamInsight時空間クエリを使用) <br> Galić et al. (2012) and Galić (2016a) (OCEANUS:時空間照会のための「TelegraphCQ」の拡張)<br>Galić et al. (2017) (MobyDick:移動オブジェクトの分散リアルタイム監視のためのApache Flinkに基づくオープンソースプロトタイプ| | DBMSの拡張|特定のシステム|Schüller et al. (2010) (継続的な空域監視のためにDBMS(Microsoft SQL Server)を使用)<br>Hendawi et al. (2016) (Microsoft SQL Server用の時空間ライブラリ) | * **Query Languages** <br> システムを使用してGeoStreamをクエリするときは、クエリを定義する必要がある。 SQLなどのクエリ言語は、そのようなクエリを定式化するための可能な方法ですが、GeoStreamの時空間的側面により、高度なクエリを表現するために必要な拡張機能またはまったく新しい言語が作成される。 この分野の研究では、SQL(Patroumpas and Sellis 2004)やSPARQL(Eometal。2015; Perry et al.2011)などの既存の言語を拡張または類似した言語を主に使用する。ストリームを検討している作品はほとんどない(Patroumpas and Sellis 2004; Eom et al.2015)。 ほとんどの研究はデータベースのような静的データに集中している(Mokhtar and Su 2005; de Almeida et al.2006; Perry et al.2011)。 3 **geostream mangement techs** * **Index structures** <br> | ターゲット | 基準 | 主題 | | ------ | ------ | ------ | | 連続現象 | グリッドセル | Whittier et al. (2013) (時空間近傍を素早く見つけるための時間次元を持つ3次元グリッドペインインデックス) | |移動オブジェクト|グリッドセルと四分木|Cudre-Mauroux et al. (2010) (圧縮に基づく四分木、入ってくるデータと問い合わせに適応) <br> Ray et al. (2013) (Z曲線を持つグリッドセルに基づくインメモリインデックス)| | 移動オブジェクト|列指向|Wang et al. (2014) (インメモリ列指向トラジェクトリインデックス構造)| | 移動オブジェクト|Rツリー|Silva et al. (2009) (アップデートメモ付きRツリー(RUMツリー)、Rツリーの更新コストを削減)| | 移動オブジェクト|Bツリー|Agarwal et al. (2003) (動的B木、動的データ構造を使用している更新の数を減らす) <br>Jensen et al. (2004)(連続的に動いている物体を動かすためのB+木) | * **Sampling and Compression** <br> | 目標 | アプローチ | 主題 | | ------ | ------ | ------ | | 非可逆圧縮 | ラインの簡素化 | Potamias et al. (2006) (「速度と方向の著しい変化」を維持するシングルパスインメモリサンプリング) <br> Hönle et al. (2010) (DSMSへの回線簡略化の統合)| |非可逆圧縮|クラスタリング|Cudre-Mauroux et al. (2010) (類似の軌跡をクラスタ化し、複数回保存しない) | | 非可逆圧縮|地図ベース|Hönle et al. (2010) (DSMSへの地図ベースの圧縮の統合) <br>Feng et al. (2013) (大幅な速度変化などのモーション機能を保持するマップベースの圧縮)| | 非可逆圧縮|データ集約|Zhang et al. (2013) (減衰ウィンドウ関数を使用した、速度などのデータストリーム要素の集計値)| | 非可逆圧縮|サンプリング|Zhang et al. (2013) (重要なデータストリーム要素を減衰ウィンドウ関数でフィルタリングする)| | 可逆圧縮|デルタ圧縮|Cudre-Mauroux et al. (2010) (移動オブジェクトの以前の場所への差分のみを格納))| | |ミックス|Song et al. (2014) (オンライン処理が可能な、すなわちストリーム処理に使用可能な、任意の空間インデックス構造との互換性がある、空間的ロスレスおよび時間的エラー制限付き圧縮アルゴリズム) | 4. **Research Gap** <br> 1. 拡張可能問題 **DBMSとDSMS**:GeoStreamsの分野はデータベースコミュニティの中で成長してきたので、この分野で行われる多くの仕事はデータベースに基づいて、GeoStreamでできることの多くに役立つことは間違いない。 <br> **拡張可能な汎用システム**:簡単に拡張可能なGeoStream用のDSMSは、GeoStream研究の主要部分が第三者、すなわち他の研究者によって追加されることができるようにモジュール式であり得る。これらの主要部分には、索引構造、データ型、照会言語、およびデータマイニングアルゴリズムがある。 <br> 2. データ採用問題 **静的軌跡から連続流への移行**: モバイルデータ接続と位置センサーを使用して接続されたモバイルデバイスの可用性が高まるにつれて、継続的なジオストリームのためのソリューションを持つニーズが高まっている。 <br> **さまざまなタイプのGeoStreamの接続問題**:さまざまなカテゴリーのさまざまなタイプのGeoStreamに対して既存のソリューションを採用し、それらを組み合わせて結果を改善する。 e.g  異なる種類のデータの組み合わせを処理するために、システム、照会言語、および索引構造をどのように改善できる?どのようなGeoStreamの組み合わせが最も有用であり、そのようなデータの組み合わせを行うときにプライバシーの問題をどのように考慮に入れることができる? <br> 3. データ処理問題(技術問題?) **データの理解問題**:画像認識においてコンピュータは絵に何が見られるかを説明することができる、 GeoStreamに同様の目標を設定できる。新しいML技術を使用し、ストリーミング方式および時空間データ、すなわちGeoStreamに使用できるようにそれらを適応させることである。 <br> **インデックス構造問題**: ウィンドウアプローチを使用する特性→データは急速に変化し、古いデータは破棄される必要があり、クエリは空間属性を利用する。特定のプロパティを持つインデックス構造が多数ある場合は、ストリームのプロパティに基づいて最適なインデックス構造を自動的に選択できます。 <br> **言語を問い合わせる問題**:時空間データストリーム用のクエリ言語では、クエリをより高いレベルで定義できる。 しかし、現在のシステムは必ずしもそのようなユーザフレンドリなインタフェースを提供するわけではない。  <br>