Cuju - 虛擬機容錯功能實作 - 曹伯瑞

由於場地問題,第二天我們移動到另一棟大樓啦!議程教室變動請見網站上的議程表

歡迎來到 https://hackmd.io/@coscup/2019 共筆

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

點擊本頁上方的 開始用 Markdown 一起寫筆記!
手機版請點選上方 按鈕展開議程列表。

請從這裡開始

Cuju

名稱由來:蹴踘
希望 VM 在實體機掛掉時可以踢來踢去

VM Live Migration

Fault Tolerance

FT 可以在突然發生硬體故障(例如Apocalypse WWDC 2017中拉掉插頭)的時候讓備份的虛擬機器即時接手

Fine-grained dirty region tracking

https://ictjournal.itri.org.tw/Content/Messagess/contents.aspx?MmmID=654304432061644411&MSID=710603501460736344
最佳完後已經可以達到平均被保護的 VM Latency 只有 10ms 或更低的效能。

Async IO block server

對要寫入 NFS 的資料做 RAM cache,讓需要即時 response 的應用程式可以加速,加上 Quota control callback 避免 IO 過快導致的問題,在 fio 效能可以達到接近沒開 FT 的效能。

Group FT(GFT)

很多的應用程式需要 Web/Logic/DB 各一台server,單獨 FT 效能會很低,因此把多台 VM 一起作 FT 可以有效降低總回應時間。
但全部failover的時候重建會很慢,又另外實作了Partial failover 和 Dynamic resync 的功能加速重建和維持短停機時間。

TODO

  • 利用 Intel Page Modification Logging(PML) for VM Monitor 加速
  • 與 libvirt/openstack 整合
tags: COSCUP2019 系統軟體社群議程 IB201
Select a repo