APM AI Assistant とインテリジェントトラブルシューティング

7 min

APM AI Assistant とは?

APM AI Assistant は、コンテキストに基づいたガイダンスの提供、トレースの分析、調査中の次のステップの提案により、アプリケーションパフォーマンスの問題をトラブルシューティングするのに役立つインテリジェントな機能です。APM データを理解し、ソリューションに導くバーチャルエキスパートとして機能します。

Note

AI Assistant の機能は、Splunk Observability Cloud のバージョンとエンタイトルメントによって異なる場合があります。ここで説明する機能の一部はプレビュー段階であるか、特定のライセンスが必要な場合があります。

主な機能

1. トレース分析

2. ガイド付きトラブルシューティング

3. コンテキストインサイト

AI Assistant がどのように役立つか

シナリオ 1: 遅いトレースの調査

従来のアプローチ:

  1. トレースウォーターフォールを開く
  2. すべてのスパンを手動でスキャンする
  3. 所要時間を計算する
  4. 最も遅い操作を特定する
  5. 他のトレースと相互参照する
  6. 根本原因について仮説を立てる

AI Assistant を使用した場合:

  1. トレースを開く
  2. AI がハイライト: “Database query in checkout-service took 2.3s (95th percentile: 45ms)”
  3. 提案: “Check database index on orders table”
  4. 同じパターンを持つ類似のトレースにリンクする
  5. パターンがいつ始まったかを表示する

シナリオ 2: エラーパターンの理解

AI Assistant が提供する情報:

ハンズオン演習: AI を活用した APM 機能の使用

Exercise

ステップ 1: サービスインサイトの探索

  1. APMServices に移動します
  2. パフォーマンスデータのあるサービスを選択します
  3. AI が生成したインサイトやサマリーを探します
    • サービスヘルススコア
    • パフォーマンストレンド
    • 異常インジケーター
    • 主要な問題またはボトルネック

ステップ 2: AI アシスタンスによるトレース分析

  1. APMTraces に移動します
  2. 遅延またはエラーのトレースでフィルタリングします
  3. トレースウォーターフォールビューを開きます
  4. AI を活用した機能を探します
    • ハイライトされた問題のあるスパン
    • 自動クリティカルパス識別
    • ベースライントレースとの比較
    • 提案された根本原因

ステップ 3: 自動根本原因検出の活用

  1. トレースビューで Root Cause または Insights パネルを見つけます
  2. AI の提案を確認します
    • どのスパンがボトルネックか?
    • 通常の動作と比較して何が変わったか?
    • どのタグまたは属性が問題と相関しているか?
  3. 提案された調査パスに従います
  4. 特定されたコンポーネントにドリルダウンします

ステップ 4: トレース比較の使用

  1. 問題のあるトレースを選択します
  2. Compare または Similar Traces 機能を探します
  3. AI が以下を表示します
    • 類似の正常なトレース(ベースライン)
    • 遅いトレースで何が異なるか
    • 統計的比較
  4. 異常なコンポーネントを特定します

インテリジェントトレース機能

クリティカルパスハイライト

AI は分散トレース内のクリティカルパスを自動的に特定します

スパン異常検出

AI は以下を考慮して異常なスパンを検出します

サービス依存関係インテリジェンス

AI はサービスアーキテクチャを理解します

AI を活用した APM アラート

スマートアラート優先順位付け

AI は以下によりアラートの優先順位付けを支援します

適応型しきい値

APM ベースのディテクターの場合

自然言語機能

質問する(利用可能な場合)

一部の AI Assistant 実装では、自然言語クエリが可能です

質問の例:

AI が提供する情報:

AI Assistant のベストプラクティス

1. 豊富なコンテキストを提供する

AI がより良い支援を行えるようにします

2. 信頼するが検証する

3. AI パターンから学ぶ

4. フィードバックを提供する

AI Assistant がフィードバックをサポートしている場合

AI Assistant と他の AI 機能の組み合わせ

統合ワークフロー

  1. アラート発火(AutoDetect ML ディテクター)
  2. Tag Spotlight が問題を絞り込む
  3. APM AI Assistant が影響を受けるトレースを分析する
  4. Related Content が関連するダッシュボードを表示する
  5. Log Observer AI が相関するログパターンを表示する
  6. 解決 — 完全なコンテキストを伴う

調査フローの例

text
Alert: "Latency increased on payment-service"
Tag Spotlight: "Region: us-west-1 (87% contribution)"
APM AI: "Database span duration increased 450%"
Trace Analysis: "Connection pool exhausted"
Log Observer AI: Pattern "Connection pool timeout" increased
Related Content: Dashboard "Database Connection Health"
Root Cause: Recent traffic spike exceeded DB connection limits

制限事項と考慮事項

Tip

APM AI Assistant は、アプリケーションが包括的なタグと属性で十分にインストルメントされている場合に最も効果的です。トレースデータが豊富であるほど、AI のインサイトが向上します。

次のステップ

ワークショップのまとめと追加リソースで締めくくりましょう。