カスタムサービスヘルスダッシュボード 🏥

15 minutes  
ペルソナ

SREの帽子が似合っているので、引き続き着用してpaymentservice用のカスタムサービスヘルスダッシュボードの構築を依頼されたと想定します。要件は RED メトリクス、ログ、Synthetic テスト期間の結果を表示することです。

開発チームと SRE チームが、アプリケーションやサービスの健全性の概要を必要とすることは一般的です。これらは多くの場合、壁に取り付けられた TV に表示されます。Splunk Observability Cloud は、カスタムダッシュボードを作成することでこれに最適なソリューションを提供しています。

このセクションでは、チームのモニターや TV に表示するためのサービスヘルスダッシュボードを構築します。

Last Modified 2025/04/30

9. サービスヘルスダッシュボードのサブセクション

ダッシュボードの強化

Log Observer 演習ですでにいくつかの便利なログチャートをダッシュボードに保存したので、そのダッシュボードを拡張していきます。

壁掛け 壁掛け

演習
  • 2 つのログチャートがあるダッシュボードに戻るには、メインメニューからDashboardをクリックすると、チームダッシュボードビューに移動します。Dashboardの下にあるSearch Dashboardをクリックして、あなたのサービスヘルスダッシュボードグループを検索します。
  • 名前をクリックすると、以前に保存したダッシュボードが表示されます。 ログリスト ログリスト
  • ログ情報は便利ですが、チームにとって意味のあるものにするにはさらに情報が必要なので、もう少し情報を追加しましょう。
  • 最初のステップは、ダッシュボードに説明チャートを追加することです。New text noteをクリックし、ノート内のテキストを次のテキストに置き換えてから、Save and Closeボタンをクリックし、チャートに手順と名前をつけます。
テキストノートで使用する情報
これは**支払いサービス**のためのカスタムヘルスダッシュボードです。
ログのエラーに注意してください。
詳細については[リンク](https://https://www.splunk.com/en_us/products/observability.html)をご覧ください。
  • チャートが適切な順序になっていません。チャートを役立つように並べ替えましょう。
  • 手順チャートの上端にマウスを移動すると、マウスポインタが に変わります。これにより、ダッシュボード内でチャートをドラッグできるようになります。手順チャートを左上の位置にドラッグし、右端をドラッグしてページの 1/3 のサイズにリサイズします。
  • ログタイムラインビューチャートを手順チャートの横にドラッグして追加し、ページの残りの 2/3 を埋めるようにリサイズして、2 つのチャートの横にエラー率チャートを配置し、ページ全体を埋めるようにリサイズします。
  • 次に、ログラインチャートをページの幅にリサイズし、少なくとも 2 倍の長さになるようにリサイズします。
  • 以下のダッシュボードに似た形になっているはずです: 初期ダッシュボード 初期ダッシュボード

これは素晴らしいですね。引き続き、より意味のあるチャートを追加していきましょう。

Last Modified 2025/05/02

カスタムチャートの追加

ワークショップのこのパートでは、ダッシュボードに追加するチャートを作成し、また以前に構築したディテクターにリンクします。これにより、テストの動作を確認し、1 つ以上のテスト実行が SLA を違反した場合にアラートを受け取ることができます。

演習
  • ダッシュボードの上部にある + をクリックし、チャートを選択します。 新しいチャート画面 新しいチャート画面
  • まず、Untitled Chart入力フィールドを使用して、チャートに全体テスト所要時間という名前を付けます。
  • この演習では棒グラフまたは柱状グラフが必要なので、チャートオプションボックスの 3 番目のアイコンをクリックします。
  • Plot editorSignalボックスにsynthetics.run.duration.time.ms(これはテストの実行時間です)と入力し、Enter キーを押します。
  • 現在、異なる色の棒が表示されています。テストが実行される各リージョンごとに異なる色になっています。これは必要ないので、分析を追加することでその動作を変更できます。
  • Add Analyticsボタンをクリックします。
  • ドロップダウンからMeanオプションを選択し、mean:aggregationを選択してダイアログボックスの外をクリックします。メトリクスが集計されるため、チャートが単色に変わることに注目してください。
  • x 軸は現在、時間を表していません。これを変更するには、プロットラインの最後にある設定アイコンをクリックします。次のダイアログが開きます: シグナル設定 シグナル設定
  • ドロップダウンボックスのDisplay Units2)をnoneから Time (autoscaling)/Milliseconds(ms) に変更します。ドロップダウンがMillisecondに変わり、チャートの x 軸がテスト所要時間を表すようになります。
  • 設定アイコンをクリックするか、Closeボタンをクリックして、ダイアログを閉じます。
  • Link Detectirボタンをクリックし、以前に作成したディテクターの名前の入力を開始して、ディテクターを追加します。
  • ディテクター名をクリックして選択します。
  • チャートの周りに色付きの枠が表示され、アラートのステータスが示されます。また、以下のようにダッシュボードの上部にベルアイコンが表示されることに注目してください: ディテクター追加済み ディテクター追加済み
  • Save and Closeボタンをクリックします。
  • ダッシュボードで、チャートを移動して以下のスクリーンショットのように表示させます: サービスヘルスダッシュボード サービスヘルスダッシュボード
  • 最後のタスクとして、ページ上部(Event Overlayの横)にある 3 つのドット をクリックし、View fullscreenをクリックします。これは壁掛けテレビモニターで使用するビューです(元に戻るには Esc キーを押します)。
ヒント

時間があれば、RUM メトリクスを使用してダッシュボードにもう 1 つのカスタムチャートを追加してみてください。既製のRUM アプリケーションダッシュボードグループからチャートをコピーすることができます。または、RUM メトリクスrum.client_error.countを使用して、アプリケーションのクライアントエラー数を表示するチャートを作成することもできます。

最後に、ワークショップのまとめを行います。