まとめ
5 minutesまとめ
このワークショップをお楽しみいただけたことを願っています。本ワークショップでは、Splunk Observability Cloud を使用して Cisco AI PODs をモニタリングするために使用されるいくつかの技術を、ハンズオン形式でデプロイおよび操作する体験を提供しました。具体的には、以下の内容を体験していただきました:
- GPU ベースのワーカーノードを持つ RedHat OpenShift クラスターでの作業。
- NVIDIA NIM Operator および NVIDIA GPU Operator での作業。
- NVIDIA NIM を使用してクラスターにデプロイされた Large Language Models (LLMs) での作業。
- Red Hat OpenShift クラスターへの OpenTelemetry Collector のデプロイ。
- インフラストラクチャメトリクスを取り込むための Prometheus receiverの Collector への追加。
- クラスター内の Weaviate ベクトルデータベースのモニタリング。
- Prometheus を使用した Pure Storage メトリクスのモニタリング設定。
- Large Language Models (LLMs) と対話する Python サービスの OpenTelemetry による計装。
- LLM と対話するアプリケーションのトレースで OpenTelemetry がキャプチャする詳細情報の理解。