Workshop
まとめ
まとめ #
このワークショップをお楽しみいただけたことを願っています。このワークショップでは、Splunk Observability Cloud を使用して Cisco AI PODs を監視するために使用されるいくつかの技術をデプロイし、操作するハンズオン体験を提供しました。具体的には、以下の内容を体験していただきました
- GPU ベースのワーカーノードを持つ RedHat OpenShift クラスターの操作。
- NVIDIA NIM Operator および NVIDIA GPU Operator の操作。
- NVIDIA NIM を使用してクラスターにデプロイされた Large Language Models (LLMs) の操作。
- Red Hat OpenShift クラスターへの OpenTelemetry Collector のデプロイ。
- インフラストラクチャメトリクスを取り込むための Prometheus レシーバーのコレクターへの追加。
- クラスター内の Weaviate ベクターデータベースの監視。
- Prometheus を使用した Pure Storage メトリクスの監視設定。
- Large Language Models (LLMs) と連携する Python サービスへの OpenTelemetry によるインストルメンテーション。
- LLMs と連携するアプリケーションのトレースにおいて OpenTelemetry がキャプチャする詳細の理解。
