Try   HackMD
tags: Session Three

In-network congestion : Adaptive Routing(應凱軒)

MPIGraph static route and adaptive route

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

Static Route (靜態路由)

  • 靜態路由必須由管理人員手動輸入,好處是速度很快,不需要經過學習。但是缺點就是網路拓撲若有任何的改變,管理人員必須更新資料到Router設備之中,比較麻煩,也耗費人力,必須有個很好的維護能力才行。這種方式比較適合幾乎不會有變動的網路拓撲。

Adaptive Route = Dynamic Route(自適應路由、動態路由)

  • 動態路由就不需要手動輸入,比較屬於Worry-Free的類型,一切的工作都交給Router設備之間去協調,互相交換並學習。管理人員只要做Routing Protocol的設定即可,但是這種方式比較耗費系統資源,速度也稍微慢

  • 有關這張圖的補充及出處
    https://www.hpcwire.com/2020/03/16/gpcnet-or-gpcnot/

small message size and large message size

  • small message size
    • Message Rate
    • Non-contiguous data access
  • 封包傳輸速率是主要的問題
  • 封包聚合 將小封包聚合在一起,進而漸少封包傳送的次數和封包多餘的標頭。
  • large message size
    • congestion

Nonblocking Collective Operations

  • 非阻塞系統是指在不能立刻得到調用结果之前,函式不會阻塞當前線程,而會立刻返回的I/O系统。調用非阻塞I/O跟阻塞I/O的差别為調用之后立即返回,返回后,CPU的時間片可以用来處理其他事務,此時性能是提升的。
  • in order(MPI model) 所有進程必須以相同的順序調用每個通信器的集合操作
  • tagged operation (AI/DL model) 啟動集合操作無順序要求(需要專用資源)