AutoDetect と ML 駆動の異常検知

4 min

AutoDetect とは?

AutoDetect は、手動でのしきい値設定を必要とせずに、メトリクスに対してインテリジェントなディテクターを自動的に作成する機械学習ベースの機能です。静的なしきい値を推測する代わりに、AutoDetect はメトリクスの正常な動作パターンを学習し、逸脱が発生した際にアラートを発します。

AutoDetect の仕組み

AutoDetect は複数の ML 技術を使用します

  1. ベースライン学習: 過去のデータを分析して正常なパターンを把握します
  2. 季節性の認識: 日次、週次、月次のパターンを認識します
  3. 動的しきい値: メトリクスの変動性に基づいて感度を調整します
  4. コンテキスト異常: よりスマートなアラートのために複数のシグナルを総合的に考慮します

ML ベースのディテクターの種類

突発的変化の検知

メトリクスが学習済みパターンを超えて急激にスパイクまたはドロップした場合にアラートを発します。

過去データとの異常検知

時間帯や曜日のパターンを考慮しながら、現在の値を過去の基準値と比較します。

リソースディテクター

一般的なインフラストラクチャリソース(CPU、メモリ、ディスク)向けに事前設定された ML ディテクターです。

ハンズオン演習: AutoDetect ディテクターの作成

Exercise

ステップ 1: ディテクター作成画面への移動

  1. Alerts & DetectorsDetectors に移動します
  2. New Detector をクリックします
  3. AutoDetect または From Template を選択します

ステップ 2: メトリクスの選択

  1. 安定したトラフィックのあるメトリクスを選択します(例: demo.trans.latency または cpu.utilization
  2. 関連するフィルターを追加します(environment、service など)
  3. チャートを確認してデータが流れていることを確認します

ステップ 3: ML 設定の構成

  1. Sudden Change または Historical Anomaly モードを選択します
  2. 感度を調整します
    • Low: アラートが少なく、大きな逸脱のみ検知
    • Medium: バランスの取れたアプローチ(推奨)
    • High: より高感度で、微妙な変化も検知
  3. 観測ウィンドウを設定します(考慮する過去データの期間)

ステップ 4: アラート設定の構成

  1. アラートの重大度を設定します(Critical、Warning、Info)
  2. 通知先を構成します
  3. アラートメッセージをカスタマイズします
  4. 確認してディテクターを有効化します

ML ディテクターの動作について

学習期間

AutoDetect ディテクターはベースラインを確立するために時間が必要です

感度のチューニング

感度設定はディテクターの検知の積極性を制御します

text
Low Sensitivity    → Fewer false positives, might miss subtle issues
Medium Sensitivity → Balanced (default)
High Sensitivity   → Catches more anomalies, more noise possible

ベストプラクティス

  1. Medium Sensitivity から始める: アラートの量に基づいて調整します
  2. 適切なメトリクスを使用する: AutoDetect は以下のようなメトリクスで最も効果的です
    • 明確なパターンを持つメトリクス(レイテンシー、リクエストレート)
    • 安定した継続的なデータストリーム
    • 十分な過去データ
  3. 関連するディメンションでグループ化する: タグを使用して焦点を絞ったディテクターを作成します
  4. 学習時間を確保する: 最初の48時間で効果を判断しないでください
  5. レビューとチューニング: トリガーされたアラートを定期的にレビューし、感度を調整します

AutoDetect と静的しきい値の使い分け

AutoDetect を使用する場合静的しきい値を使用する場合
メトリクスに自然な変動がある既知の固定的な制限がある
パターンが時間とともに変化する要件が規制やコンプライアンスに基づく
トラフィックが季節的または周期的単純な二値条件(稼働/停止)
「正しい」しきい値がわからないしきい値が十分に確立されている

AutoDetect のパフォーマンス監視

ML ディテクターを作成した後

  1. アラート履歴のレビュー: 誤検知/検知漏れを確認します
  2. 感度の調整: アラートの品質に基づいて微調整します
  3. ベースラインの更新: ML モデルは変化に自動的に適応します
  4. 従来のディテクターとの比較: ML がより早く問題を検知するかどうかを確認します

Tip

AutoDetect は、ユーザートラフィック、トランザクション量、API リクエストレートなど、時間帯や曜日によって変動するメトリクスに対して特に効果的です。

よくある落とし穴

次のステップ

AutoDetect について理解できたので、次は AI を活用した根本原因分析のための Tag Spotlight を見ていきましょう。