Splunk Log Observer
20 minutesペルソナ
バックエンド開発者の役割を継続して、アプリケーションのログを調査して問題の根本原因を特定する必要があります。
APM トレースに関連するコンテンツ(ログ)を使用して、Splunk Log Observer でさらに掘り下げ、問題が正確に何であるかを理解します。
関連コンテンツは、あるコンポーネントから別のコンポーネントにジャンプできる強力な機能で、メトリクス、トレース、ログで利用可能です。
バックエンド開発者の役割を継続して、アプリケーションのログを調査して問題の根本原因を特定する必要があります。
APM トレースに関連するコンテンツ(ログ)を使用して、Splunk Log Observer でさらに掘り下げ、問題が正確に何であるかを理解します。
関連コンテンツは、あるコンポーネントから別のコンポーネントにジャンプできる強力な機能で、メトリクス、トレース、ログで利用可能です。
Log Observer (LO)は、複数の方法で使用できます。クイックツアーでは、LO のコード不要インターフェースを使用して、ログ内の特定のエントリを検索しました。しかし、このセクションでは、関連コンテンツリンクを使用して APM のトレースから LO に到達したと想定しています。
これの利点は、RUM と APM 間のリンクと同様に、以前のアクションのコンテキスト内でログを見ていることです。この場合、コンテキストはトレースの時間枠(1)とtrace_idに設定されたフィルター(2)です。
このビューには、エンドユーザーとオンラインブティックのやり取りによって開始されたバックエンドトランザクションに参加したすべてのアプリケーションまたはサービスからのすべてのログ行が含まれます。
私たちのオンラインブティックのような小さなアプリケーションでさえ、見つかるログの膨大な量により、調査している実際のインシデントに関連する特定のログ行を見つけることが難しくなる場合があります。
ログ内のエラーメッセージだけに焦点を当てる必要があります:
次に、ログエントリの詳細を見ていきます。
特定のログ行を見る前に、これまでに行ったことと、可観測性の 3 本柱に基づいてなぜここにいるのかを簡単に振り返ってみましょう:
メトリクス | トレース | ログ |
---|---|---|
問題がありますか? | 問題はどこですか? | 問題は何ですか? |
v350.9
とv350.10
の 2 つのバージョンがあり、v350.10
のエラー率は 100% でした。v350.10
からのこのエラーが、複数の再試行とオンラインブティックのチェックアウトからの応答の長い遅延を引き起こしたことを確認しました。Splunk Observability Cloud を正常に使用して、オンラインブティックでショッピング中に不良なユーザーエクスペリエンスを体験した理由を理解しました。RUM、APM、ログを使用して、サービス環境で何が起こったかを理解し、その後、可観測性の 3 本柱であるメトリクス、トレース、ログに基づいて根本原因を見つけました。
また、アプリケーションの動作パターンを検出するためにTag Spotlightでインテリジェントなタグ付けと分析を使用する方法と、問題のコンテキストを維持しながら異なるコンポーネント間を迅速に移動するために関連コンテンツのフルスタック相関パワーを使用する方法も学びました。
ワークショップの次のパートでは、問題発見モードから緩和、防止、プロセス改善モードに移行します。
次は、カスタムダッシュボードでのログチャートの作成です。
Log Observer で特定のビューを持った後、そのビューをダッシュボードで使用できると、将来的に問題の検出や解決にかかる時間を短縮するのに非常に役立ちます。ワークショップの一環として、これらのチャートを使用する例示的なカスタムダッシュボードを作成します。
ログタイムラインチャートの作成を見ていきましょう。ログタイムラインチャートは、時間経過に伴うログメッセージを視覚化するために使用されます。ログメッセージの頻度を確認し、パターンを特定するための優れた方法です。また、環境全体でのログメッセージの分布を確認するための素晴らしい方法でもあります。これらのチャートはカスタムダッシュボードに保存できます。
まず、関心のある列のみに情報量を減らします:
_raw
のチェックを外し、次のフィールドが選択されていることを確認します:k8s.pod.name
、message
、version
。
trace_id
を削除し、フィールドsf_service=paymentservice
とsf_environment=[WORKSHOPNAME]
を追加します。ログタイムライン
を使用します。イニシャル - サービスヘルスダッシュボード
、そしてSaveをクリックします。次に、ログビューチャートを作成します。
ログで使用できる次のチャートタイプはログビューチャートタイプです。このチャートでは、事前定義されたフィルターに基づいてログメッセージを確認できます。
前回のログタイムラインチャートと同様に、このチャートのバージョンをカスタマーヘルスサービスダッシュボードに追加します:
sf_service=paymentservice
、sf_environment=[WORKSHOPNAME]
でフィルタリングされている必要があります。次のセッションでは、Splunk Synthetics を見て、Web ベースのアプリケーションのテストを自動化する方法を確認します。