トラブルシューティング
15 minutesこのセクションでは、KubernetesでThousandEyes Enterprise Agentをデプロイおよび使用する際に遭遇する可能性のある一般的な問題について説明します。
DNS 解決エラーでテストが失敗する
テストがDNS解決エラーで失敗している場合は、ThousandEyes Pod内からDNSを確認してください:
一般的な原因:
- 指定されたnamespaceにサービスが存在しない
- サービス名またはnamespaceの入力ミス
- CoreDNSが正常に機能していない
接続拒否エラー
接続拒否エラーが発生している場合は、以下を確認してください:
一般的な原因:
- サービスをバックアップするPodがない(endpointsが空)
- PodがReady状態でない
- テストURLで間違ったポートが指定されている
- サービスセレクターがPodラベルと一致しない
Network Policy がトラフィックをブロックしている
Network PolicyがThousandEyesエージェントからのトラフィックをブロックしている場合:
解決策:
te-demo namespaceからサービスへのトラフィックを許可するNetwork Policyを作成します:
エージェント Pod が起動しない
ThousandEyesエージェントPodが起動しない場合は、Podのステータスとイベントを確認してください:
一般的な原因:
- リソース不足(memory/CPU)
- 無効または欠落しているTEAGENT_ACCOUNT_TOKENシークレット
- Pod Security Policyによってセキュリティコンテキストのケイパビリティが許可されていない
- イメージプルエラー
解決策:
- OOMKilledの場合はメモリ制限を増やす
- シークレットが正しく作成されているか確認する:
kubectl get secret te-creds -n te-demo -o yaml - Pod Security PolicyがNET_ADMINおよびSYS_ADMINケイパビリティを許可しているか確認する
- イメージプルを確認する:
kubectl describe pod -n te-demo <pod-name>
エージェントが ThousandEyes ダッシュボードに表示されない
エージェントは実行中だがThousandEyesダッシュボードに表示されない場合:
一般的な原因:
- 無効または不正なTEAGENT_ACCOUNT_TOKEN
- ネットワークのEgressがブロックされている(ファイアウォールまたはNetwork Policy)
- エージェントがThousandEyes Cloudサーバーに到達できない
解決策:
- トークンが正しく、適切にbase64エンコードされているか確認する
*.thousandeyes.comへのEgressが許可されているか確認する- エージェントがインターネットに到達できるか確認する:
データが Splunk Observability Cloud に表示されない
ThousandEyesのデータがSplunkに表示されない場合:
統合の設定を確認:
- ThousandEyesでOpenTelemetry統合が正しく設定されているか確認する
- SplunkインジェストエンドポイントURLがお使いのRealmに対して正しいか確認する
X-SF-Tokenヘッダーに有効なSplunkアクセストークンが含まれているか確認する- テストが統合に割り当てられているか確認する
テストの割り当てを確認:
一般的な原因:
- エンドポイントURLのSplunk Realmが間違っている
- 無効または期限切れのSplunkアクセストークン
- テストがOpenTelemetry統合に割り当てられていない
- 統合が適切に有効化または保存されていない
分散トレーシングが ThousandEyes に表示されない
メトリクスストリームは機能しているが、ThousandEyesの Service Map が空であるか、トレースが見つからない場合:
監視対象のエンドポイントを確認:
- HTTPヘッダーを受け入れること
- OpenTelemetryで計装されていること
- トレースコンテキストを下流に伝播すること
- Splunk APMにトレースを送信すること
一般的な原因:
- エンドポイントがHTTP ServerまたはAPIターゲットではなくページURLである
- サービスが計装されていないため、ThousandEyesはヘッダーを注入できるがトレースは出力されない
- エンドポイントがローカルのヘルスレスポンスのみを返し、下流サービスを実行しない
推奨される修正:
- ThousandEyesテストを計装されたバックエンドAPIルートに切り替える
- そのルートのトレースが既にSplunk APMに存在することを確認する
- ThousandEyes分散トレーシングを有効にした後、テストを再実行する
Splunk APM に ThousandEyes リンクが表示されない
トレースがSplunk APMで開くが、ThousandEyesのバックリンクやメタデータが表示されない場合:
一般的な原因:
b3 プロパゲーターが trace_state を上書きし、ThousandEyesがリバースリンクのために保持することを期待している値をクリアする可能性があります。
修正:
計装されたサービスでプロパゲーターを明示的に設定します:
環境変数を変更した後、計装されたワークロードを再起動し、新しいトラフィックを生成します。
Splunk APM Connector の認証エラー
ThousandEyesの Generic Connector がSplunk APMにクエリできない場合:
以下を確認してください:
- コネクターのターゲットが
https://api.<REALM>.signalfx.comであること - コネクターで使用されているトークンが API スコープを持っていること
- トークンを作成するユーザーがSplunk Observability Cloudで必要なロールを持っていること
トークンに関する注意
OpenTelemetryメトリクスストリームはSplunk Ingest トークンを使用します。APM用のThousandEyes Generic Connector はSplunk API トークンを使用します。これらを混同することは、部分的な統合の最も一般的な原因の一つです。
メモリ使用量が高い
ThousandEyesエージェントPodが過剰なメモリを消費している場合:
解決策:
- デプロイメントでメモリ制限を増やす:
- エージェントに割り当てられた同時テストの数を減らす
- エージェントが不要なサービスを実行していないか確認する
Permission Denied エラー
エージェントのログにPermission Deniedエラーが表示される場合:
セキュリティコンテキストを確認:
解決策: Podに必要なケイパビリティがあることを確認します:
注意
厳格なPod Security Policyを持つ一部のKubernetesクラスターでは、これらのケイパビリティが許可されない場合があります。適切なポリシー例外を作成するために、クラスター管理者と協力する必要があるかもしれません。
サポートを受ける
このガイドでカバーされていない問題に遭遇した場合:
- ThousandEyes Support: support.thousandeyes.com でThousandEyesサポートに連絡してください
- Splunk Support: Splunk Observability Cloudの問題については、Splunk Support をご覧ください
- コミュニティフォーラム:
ヒント
サポートを求める際は、より効果的にトラブルシューティングできるよう、関連するログ、Podの説明、エラーメッセージを必ず含めてください。