某監視プロダクトのウェビナーを聞いて、SREとDevOpsについての話があったのでメモ。
SRE本読めば載ってるんだと思うけど。
GoogleのDevOps2019レポートも読もうと思う。
https://services.google.com/fh/files/misc/state-of-devops-2019.pdf
オブザーバビリティとは?
- 監視→何かが間違ってるときに通知
- オブザーバビリティ→根本原因まで特定可能
DevOpsとSRE
- Googleの2019レポート
- 成長企業は以下が圧倒的に違う
- デプロイ頻度
- コミットからデプロイまでの時間
- 障害からの復旧時間
- 変更時のエラー発生率
- DevOpsとは文化/ツール/プラクティスの3つで構成され、開発と運用のフィードバックサイクルの高速化を行うこと
- SREとはソフトウェアエンジニアが運用を設計したらどうなるのか?ということ
- SREはシステムの信頼性に重きを置く
- 運用にかけていいリソースは活動の50%まで、50%以上は信頼性を向上するためのコード生成を行うこと
- 信頼性とは、システムが求められる機能を、定められた条件の下で定められた期間にわたり、障害を起こすことなく実行する確率
- 信頼性向上はこの確率(サービスレベル)の改善