L2. Надежность системы

# L2. Надежность системы ###### tags: `L2` `BFT` `PAXOS` `Консенсус` `SLA` `Доступность` `Отказоустойчивость` ## Контекст Неплохая вводная статья на [wiki](https://ru.wikipedia.org/wiki/%D0%9D%D0%B0%D0%B4%D1%91%D0%B6%D0%BD%D0%BE%D1%81%D1%82%D1%8C). ## Метрики ### Долговечность персистентной памяти Хранение данных(в нашем случае субд foundationDB) - **11x9s**(99.999999999) [расшифровка тут](https://wasabi.com/blog/11-nines-durability/). > Служба хранения с показателем доступности 11x9s на 1 миллион объекстов(файлов, транзакций) теряет один объект каждые 659 000 лет. У вас примерно в 411 раз больше шансов получить удар от метеора. ### Доступность сервера приложения При использования географически-распределенного резервирования сервера приложений можно достигнуть безотказной работы системы в течении **99,9999** времени. Те при реализации всех рисков отказа датацентров в регионе, регионов - система будет не доступна в худшем случае в **течении 31 секунды**(это время необходимое протоколу восстановления для переключения между регионами) в году: ![](https://hackmd.io/_uploads/rJf29zQuU.png) ## Внешние ссылки * Введение в специальность SRE на [Хабр](https://habr.com/ru/company/piter/blog/420139/) *