2021/03/01　追記

記載していたリポジトリにあるマニフェスト系があまりに不親切だったので、ちゃんとまとめてみました。
後日、もうちょっとちゃんと記事書こうとは思いますが、大体はREADMEにあるので読んでみてください。
sock-shopをベースにObservability（Prometheus, Loki, Istio(Jaeger, Kiali)）とProgressive Delivery＆自動負荷試験スタック（Flagger, Jmeter, influxdb）をHelmとKustomizeで詰め込みました。
今回はちゃんと誰もが入れれるようにがんばってみたので、どうぞ。

この内容でCloudNativeDaysOnline2021に登壇することにしています。

event.cloudnativedays.jp

後、随分前ではありますが、本投稿に関連してKubernetes meetup tokyo #33で「Kubernetesでの性能解析～なんとなく遅いからの脱却～」というタイトルで登壇をしました。

Kubernetesでの性能解析～なんとなく遅いからの脱却～（Kubernetes Meetup Tokyo #33 発表資料） from NTT DATA Technology & Innovation

www.slideshare.net

GitHubにKubernetesの性能監視で必要なメトリクス一覧をまとめた。
また、それに伴って必要なPrometheusのExporter、それらのmetrics endpointに対するScrapeの方針とyamlのサンプル、GrafanaのダッシュボードJsonもまとめた。
改善余地はまだまだあると思うのでPRやコメント等大歓迎です。

監視すべき項目
- サービス監視（RED）
- リソース監視（USE）http://www.brendangregg.com/usemethod.html
前提条件
メトリクス一覧

監視すべき項目

監視すべき項目はUSE×REDだと認識している。
それを各コンポーネントの粒度でまとめている。
Cluster, Node, Pod/Container, MW(Java, Go, Nodejs, etc), Kubernetes コンポーネント自体

サービス監視（RED）

Rate : =Throughput, 秒間リクエスト数, 秒間 PV 数
Error Rate : エラー率, 5xx とか
Duration : =ResponseTime, %ile 評価が一般的

リソース監視（USE）http://www.brendangregg.com/usemethod.html

Utilization : 使用率 E.g. CPU 使用率
Saturation : 飽和度, どれくらいキューに詰まっているか
E.g. ロードアベレージ
Errors : エラーイベントの数

前提条件

以下のバージョンを前提に設定のサンプルは用意している。

Kubernetes : v1.16.11-gke.5
Istio : 1.4.10-gke.4
Prometheus : prom/prometheus:v2.18.0
Grafana : grafana/grafana:7.0.1
NodeExporter : prom/node-exporter:v1.0.0

メトリクス一覧

以下のGitHubにも同様のReadme.mdをおいてます。 github.com

メトリクス		USE x RED	Prometheus	Grafana Dashboard
Throughput	request_duration_seconds をヒストグラム集計	R	o	TBD
ResponseTime		D	o
Error%		E	o

メトリクス		USE x RED	Prometheus
Node Availability	ノード全体の稼働率各ノードの Ready 時間合計/(集計期間 × ノード数)	Availability
	Node 数	Availability	o
	unschedulable Node 数	Availability	o
	Node の詳細 kubernetes.node.name,各リソース量	Conf	o
Pods Availability	Available Pods 数	Availability	o
	Pods status Running / Pending / Failed / Unknown	Availability	o
Container Availability	Containers status Ready / Terminated / Waiting / Running	Availability	o
Deployment Count	Deployment Count	Availability	o
StatefulSet Count	StatefulSet Count	Availability	o
DaemonSet Count	DaemonSet Count	Availability	o
Job Count	Job Count	Availability	o
	Failed Job Count	Availability	o

メトリクス		USE x RED	Prometheus
ファイルシステム	ディスク領域使用量	U	o
	inode 総数/使用率	U	o

メトリクス		USE x RED
コネクション数	Active / Dropped	S
スループット	request per sec	R
HTTP	レスポンスコード	E
レイテンシ	Response Time	D
Network bytes

メトリクス		USE x RED	Prometheus
ヒープメモリ	全体ヒープメモリ使用量	U	o
	Young	U	o
	Old	U	o
	Metaspace	U	o
	Code Cache	U	o
GC	頻度（Full/Young）	S	o
	時間（Full/Young）	S	o
レスポンスタイム	レスポンスタイム	D	?
レスポンスコード	レスポンスコード	E	?
スレッド数	スレッド数	S	o
空きスレッド数	空きスレッド数	Conf	?
スレッドプール使用率	スレッドプール使用率	S	?
コネクションプール使用数	コネクションプール使用数	S	?

メトリクス	USE x RED	Prometheus
Process Memory	U	o
Memory Stats	U	o
Goroutines	S	o
GC duration	S	o \| ##### Grafana Dashboard

メトリクス		USE x RED	Prometheus
API コール	REST リクエスト数	R	o
	API リクエストレイテンシ	D	o
	API リクエストエラー	E	o
Controller Manager から	ワークキューの追加率		o
	ワークキューの待ち時間		o
	ワークキューの深さ		o
etcd から	etcd キャッシュエントリ		x
	etcd キャッシュのヒット/ミス率		x
	etcd キャッシュ期間		x
リソース	メモリ使用量		o
	CPU 使用量		o
	Go routine		o

メトリクス		USE x RED	Prometheus
インスタンス	kube-controller-manager インスタンスの数
ワークキュー情報	ワークキューのレイテンシー
	ワークキューレート
	ワークキューの深さ
kube-api	kube-api リクエストレート
	kube-api リクエストレイテンシ
リソース	メモリ使用量
	CPU 使用量
	Go routine

メトリクス		USE x RED	Prometheus
Leader	Leader 変更回数
Database 系	DB サイズ
	Disk 同期レイテンシ
	Disk 操作 (fsync, commit)
Network	Client Trafic
	Peer Trafic
	Raft Proposal
	Proposal Committed
	Proposal Pending
	grpc
snapshot	snapshot レイテンシ

メトリクス		USE x RED	Prometheus
Scheduling	Scheduling レート
	Scheduling レイテンシ
kube-api	kube-api リクエストレート
	kube-api リクエストレイテンシ
リソース	メモリ使用量
	CPU 使用量
	Go routine
Leader	Leader 変更回数

メトリクス		USE x RED	Prometheus
Pods Availability	Available Pods 数	Availability	o
	Pods Restarts	Availability	o
	Pods status Running / Pending / Failed / Unknown	Availability	o
Container Availability	Restarts	Availability	o
	Errors Terminated Reason Waiting Reason Restart Reason	E	o
	Containers status Ready / Terminated / Waiting / Running	Availability	o
CPU	CPU 使用率	U	o
	ロードアベレージ	S	o
	Throttle	S	o
	CPU Core Limits	Conf	o
	CPU Core Requests	Conf	o
メモリ	メモリ使用量	U	o
	スワップイン量	S	x
	スワップアウト量	S	x
	スワップ使用量	S	o
	スワップサイズ	S	x
	Memory Limits	Conf	o
	Memory Requests	Conf	o
ディスク	ディスクビジー率	U	o
	ディスク I/O 待ち数	S	o
	ディスク I/O 待ち時間	S	o
	ディスク読込み量	U	o
	ディスク書込み量	U	o
	ディスク読込み回数	U	o
	ディスク書込み回数	U	o
	パーティション使用率	U	o
	パーティションサイズ	U	△
	inode 総数/使用率	U	o
ネットワーク	送信トラフィック量	U	o
	受信トラフィック量	U	o
	ポート/Socket	U	△
	Drops	E	o
	Errs	E	o
	ping	Availability
	ファイルディスクリプタ	U	△

メトリクス		USE x RED	Prometheus
インスタンス	kubelet インスタンスの数	Availability	o
	ボリュームの数	Availability	o
error	error	E	o
オペレーション	各タイプのランタイムオペレーションの総数	U	o
	オペレーションのエラーの数 ※コンテナランタイムの問題など、ノード内の低レベルの問題を示す良い指標	E	o
	オペレーションの間隔時間	S	o
Pod の管理	ポッドのスタートレートと間隔時間コンテナのランタイムまたはイメージへのアクセスの問題を示している可能性がある	S	o
	ポッドスタートオペレーションの数	U	o
ストレージ	ストレージオペレーション数	U	o
	ストレージオペレーションエラー	E	o
	ストレージオペレーション時間	S	o
Cgroup マネージャ	Cgroup マネージャのオペレーション数	U	o
	Cgroup マネージャのオペレーション時間	S	o
ポッドライフサイクルイベントジェネレータ	ポッドライフサイクルイベントジェネレーター（PLEG）： relist レート、relist インターバル、relist 間隔時間。これらの値のエラーまたは過度の遅延は、ポッドの Kubernetes ステータスに問題を引き起こす可能性があ	U	o

Exporter	Scrape Target Endpoint	Scrape Config Sample の job name
cadvisor	apiserver の以下 metrics パス https://kubernetes.default.svc:443/api/v1/nodes/gke-cn-horiuchiysh-s-cn-horiuchiysh-s-2b141725-5coq/proxy/metrics/cadvisor	kubernetes-cadvisor
NodeExporter	各 pod のコンテナポートの/metrics へ投げる nodexporter/metrics	kubernetes-pods
go	各 pod のコンテナポートの/metrics へ投げる go/metrics	kubernetes-service-endpoints
nodejs	各 pod のコンテナポートの/metrics へ投げる nodejs/metrics	kubernetes-service-endpoints
mongodb	各 pod のコンテナポートの/metrics へ投げる mongodb/metrics	kubernetes-pods
Istio Mesh	istio-telemetry サービスの endpoint port name が prometheus http://10.48.2.14:42422/metrics	istio-mesh
kubelet	各ノードの 10255 ポート http://10.30.3.20:10255/metrics10255	kubernetes-nodes
kube-apiserver	default namespace に api server 向けの svc と endpoint がある https://104.198.95.200:443/metrics	kubernetes-service-endpoints
kube-state-metrics	各サービスの/metrics へ投げる http://kube-state-metrics:8080/metrics	kubernetes-service-endpoints
prove	/api/v1/nodes/gke-cn-horiuchiysh-s-cn-horiuchiysh-s-2b141725-5coq/proxy/metrics/probes	ベット job が必要
kube-controll-manager	デフォルトでエンドポイントを公開しないコンポーネントの場合、--bind-address フラグを使用して有効にする /metrics
kube-proxy	デフォルトでエンドポイントを公開しないコンポーネントの場合、--bind-address フラグを使用して有効にする /metrics
kube-scheduler	デフォルトでエンドポイントを公開しないコンポーネントの場合、--bind-address フラグを使用して有効にする /metrics

メトリクス		USE x RED
Proxy ルール Sync	Proxy ルール Sync レート	R
	Proxy ルール Sync レイテンシ	D
Network Programming	Network Programming レート	R
	Network Programming レイテンシ	D
kube-api	kube-api リクエストレート
	kube-api リクエストレイテンシ
リソース	メモリ使用量
	CPU 使用量
	Go routine

Exporter	Link
Node Exporter	NodeExporter https://github.com/kashinoki38/microservices-demo/blob/master/deploy/kubernetes/manifests-monitoring/node-exporter-ds.yml
kube-state-metrics	kube-state-metrics https://github.com/kubernetes/kube-state-metrics/tree/master/docs

監視すべき項目

サービス監視（RED）

リソース監視（USE）http://www.brendangregg.com/usemethod.html

前提条件

メトリクス一覧

サービス監視（RED）

Jmeter

Grafana Dashboard

Grafana Dashboard

システムサイド Istio Telemet

Grafana Dashboard

システムサイド Prometheus クライアントライブラリを利用

Grafana Dashboard

OS リソース監視（USE）

クラスタ全体

Grafana Dashboard

Node

Grafana Dashboard

Pod/Container

Grafana Dashboard

Persistent Volume

Grafana Dashboard

MW リソース監視

Nginx

Grafana Dashboard

Java (Jetty on SpringBoot)

Grafana Dashboard

Go

Grafana Dashboard

Nodejs

Grafana Dashboard

MySQL

Grafana Dashboard

mongodb

Grafana Dashboard

Redis

Grafana Dashboard

Kubernetes コンポーネント

kube-api-server

Grafana Dashboard

kube-controller-manager

Grafana Dashboard

etcd

Grafana Dashboard

Grafana Dashboard

kube-scheduler

Grafana Dashboard

kube-proxy

Grafana Dashboard

kubelet

Grafana Dashboard

Prometheus

Grafana Dashboard

必要な Exporter

各 Exporter に対する Scrape 方針

Scrape Config Sample

kubernetes-pods

kubernetes-nodes

kubernetes-cadvisor

istio-mesh

kubernetes-service-endpoints

prometheus.yaml の relabel_config

検討必要事項

Jmeter との連携

システムサイド　 Istio Telemet

システムサイド　 Prometheus クライアントライブラリを利用