AutoDetect と ML 駆動の異常検知
AutoDetect とは? #
AutoDetect は、手動でのしきい値設定を必要とせずに、メトリクスに対してインテリジェントなディテクターを自動的に作成する機械学習ベースの機能です。静的なしきい値を推測する代わりに、AutoDetect はメトリクスの正常な動作パターンを学習し、逸脱が発生した際にアラートを発します。
AutoDetect の仕組み #
AutoDetect は複数の ML 技術を使用します
- ベースライン学習: 過去のデータを分析して正常なパターンを把握します
- 季節性の認識: 日次、週次、月次のパターンを認識します
- 動的しきい値: メトリクスの変動性に基づいて感度を調整します
- コンテキスト異常: よりスマートなアラートのために複数のシグナルを総合的に考慮します
ML ベースのディテクターの種類 #
突発的変化の検知 #
メトリクスが学習済みパターンを超えて急激にスパイクまたはドロップした場合にアラートを発します。
過去データとの異常検知 #
時間帯や曜日のパターンを考慮しながら、現在の値を過去の基準値と比較します。
リソースディテクター #
一般的なインフラストラクチャリソース(CPU、メモリ、ディスク)向けに事前設定された ML ディテクターです。
ハンズオン演習: AutoDetect ディテクターの作成 #
Exercise
ステップ 1: ディテクター作成画面への移動
- Alerts & Detectors → Detectors に移動します
- New Detector をクリックします
- AutoDetect または From Template を選択します
ステップ 2: メトリクスの選択
- 安定したトラフィックのあるメトリクスを選択します(例:
demo.trans.latencyまたはcpu.utilization) - 関連するフィルターを追加します(environment、service など)
- チャートを確認してデータが流れていることを確認します
ステップ 3: ML 設定の構成
- Sudden Change または Historical Anomaly モードを選択します
- 感度を調整します
- Low: アラートが少なく、大きな逸脱のみ検知
- Medium: バランスの取れたアプローチ(推奨)
- High: より高感度で、微妙な変化も検知
- 観測ウィンドウを設定します(考慮する過去データの期間)
ステップ 4: アラート設定の構成
- アラートの重大度を設定します(Critical、Warning、Info)
- 通知先を構成します
- アラートメッセージをカスタマイズします
- 確認してディテクターを有効化します
ML ディテクターの動作について #
学習期間 #
AutoDetect ディテクターはベースラインを確立するために時間が必要です
- 最小: 24時間のデータ
- 推奨: 安定したベースラインのために1〜2週間
- 季節パターン: 週次パターンのために4週間以上
感度のチューニング #
感度設定はディテクターの検知の積極性を制御します
text
Low Sensitivity → Fewer false positives, might miss subtle issues
Medium Sensitivity → Balanced (default)
High Sensitivity → Catches more anomalies, more noise possibleベストプラクティス #
- Medium Sensitivity から始める: アラートの量に基づいて調整します
- 適切なメトリクスを使用する: AutoDetect は以下のようなメトリクスで最も効果的です
- 明確なパターンを持つメトリクス(レイテンシー、リクエストレート)
- 安定した継続的なデータストリーム
- 十分な過去データ
- 関連するディメンションでグループ化する: タグを使用して焦点を絞ったディテクターを作成します
- 学習時間を確保する: 最初の48時間で効果を判断しないでください
- レビューとチューニング: トリガーされたアラートを定期的にレビューし、感度を調整します
AutoDetect と静的しきい値の使い分け #
| AutoDetect を使用する場合 | 静的しきい値を使用する場合 |
|---|---|
| メトリクスに自然な変動がある | 既知の固定的な制限がある |
| パターンが時間とともに変化する | 要件が規制やコンプライアンスに基づく |
| トラフィックが季節的または周期的 | 単純な二値条件(稼働/停止) |
| 「正しい」しきい値がわからない | しきい値が十分に確立されている |
AutoDetect のパフォーマンス監視 #
ML ディテクターを作成した後
- アラート履歴のレビュー: 誤検知/検知漏れを確認します
- 感度の調整: アラートの品質に基づいて微調整します
- ベースラインの更新: ML モデルは変化に自動的に適応します
- 従来のディテクターとの比較: ML がより早く問題を検知するかどうかを確認します
Tip
AutoDetect は、ユーザートラフィック、トランザクション量、API リクエストレートなど、時間帯や曜日によって変動するメトリクスに対して特に効果的です。
よくある落とし穴 #
- データ不足: パターンを学習するために十分な履歴が必要です
- ディメンションが多すぎる: タグで細かく分割しすぎると ML モデルの精度が低下する可能性があります
- 不安定なメトリクス: 非常に不規則なメトリクスはノイズの多いアラートを生成する可能性があります
- 最近のデプロイ: 新しいサービスにはベースラインデータがありません
次のステップ #
AutoDetect について理解できたので、次は AI を活用した根本原因分析のための Tag Spotlight を見ていきましょう。
