インシデントインテリジェンスを設定すると、システムはデータソースから問題の検出を開始します。
issue feed では、すべての課題の概要と、課題に関する有用な情報を見ることができます。また、個々の課題をクリックすると、分析サマリ、イベントログ、関連する課題の詳細など、より詳細な情報を得ることができます。
このスクリーンショットは、課題のステータスや相関関係などが記載された課題フィードの例です。
イシュー、インシデント、イベントの違いは何ですか? 要するに、これらの用語は積み木のようなものです。イベントは、お客様のソースからの生のデータです。インシデントは、1つまたは複数のイベントで構成されます。イシューは、1つまたは複数のインシデントで構成されます。
もっと詳しく言うと
- 問題は、症状の根本的な問題を説明するインシデントのグループです。新しいインシデントが作成されると、インシデントインテリジェンスによって問題が開かれ、他の未解決の問題の相関関係が評価されます。
- インシデント は、システムの"症状" を時系列で表すイベントのグループです。これらの症状は、データストリームやイベントを評価する監視ツールによって検出されます。
- イベントは、監視システムによって定義された状態の変化またはトリガーを示します。イベントには影響を受けるエンティティに関する情報が含まれており、ほとんどの場合、システムによって自動的にトリガーされます。
根本原因の分析
根本原因分析では、問題とその影響を受けるエンティティの潜在的な原因を自動的に検出します。これにより、未解決の問題が発生した理由、どのデプロイメントが原因となったか、関連するエラーログや属性などが表示されます。これにより、問題を調査し、解決までの平均時間(MTTR)を短縮することができます。
ヒント
なお、根本原因分析は他のNew Relicのデータソースや機能に依存しています。そのため、すべての問題に対して根本原因分析の情報が常に存在するとは限りません。
課題を選択すると、 根本原因分析 の情報が表示されることがあります。
根本原因分析には、主に3つのUIセクションがあります。
- 配置イベント: 配置を設定する際に、問題発生に最も近い配置を提供します。インシデントの根本原因のうち、デプロイメントなどの変更が占める割合は高く、その情報が手元にあれば、問題の診断や解決に役立ちます。
- エラーログ: 何百万ものログメッセージをワンクリックで探索したり、マニュアルクエリを使用して、異常なパターンや見つけにくい問題の発見に役立てることができます。
- 調査する属性: 属性の分布をスキャンし、分布の著しい変化を見つけることで、考えられる原因を表面化します。ここでは、データベースや外部のメトリクスの変化も示します。また、 興味深い属性を照会することができます.
影響を受けるエンティティと問題マップ
エンティティにマウスオーバーすると、そのエンティティの詳細情報が表示されます。
影響を受ける事業体 のセクションでは、2つ以上の事業体が関係する問題について、課題マップを利用できます。 マップ には、影響を受けるエンティティだけでなく、それらのエンティティに直接関連するサービスやリソースも表示されます。
影響を受けたエンティティ: エンティティとは、監視できるデータを持つものを指します。具体的には、New Relic のソースからのインシデントに着目し、エンティティを抽出してサマリーを提供します。各エンティティは固有のものです。エンティティは、リストやマップで確認することができます。
イシューのデータに応じて、これら4つのセクションはイシューごとにまとめて表示されることもあれば、別々に表示されることもあります。
- Relevant dashboards は、お客様のアカウントのユーザーが、エンティティに関連してお客様が作成した ダッシュボード を見たり、それを操作したりするのに役立ちます。様々なウィジェットを動かすために実行したクエリは、可能な限り自動的にエンティティにマッピングされ、迅速なアクセスと発見のためにここに表示されます。
- 異常の概要により、アプリケーションの異常ページが開きます。これは、プロアクティブな検出用に設定されたアプリケーションでのみ使用できます。
- デプロイメント イベント には、「デプロイメント」と「関連するデプロイメント」の 2 種類があります。 [Show all deployments] をクリックすると、すべてのデプロイメント イベントが届いたときに表示され、特定のデプロイメントをクリックすると、その APM デプロイメント ページが表示されます。 APM 配置ページ には、最近の配置と、その配置がエンドユーザやアプリサーバの Apdex スコア、応答時間、スループット、エラーに与える影響が一覧表示されます。このセクションは、New Relic が影響を受けるエンティティの下で、デプロイメントを持つアプリケーションを特定した場合にのみ表示されます。
課題のタイムライン
イシューのタイムラインを見ると、以下のような内訳になっています。
- インシデント
- 起こっているトレンド
- どのインシデントがアクティブか
- どのようなインシデントが解決されたか
- 互いに相関しているもの
- 課題レベルに応じた様々なマイルストーン
さらに、タイムラインの上部にグレーのラインが表示されています。各インシデントへの変更を示す視覚的なタイムラインと比較すると、グレーのラインはイシューへの変更を表しています。
グレーのラインにマウスオーバーすると、イベントの詳細が表示されます。
最後に、インシデントにマウスオーバーすると、特定のインシデントの場所、タイミング、重要度などの情報が表示されます。
この図は、1月11日に入力された特定のインシデントを示しており、そのレベルは Critical となっています。
課題をテキスト形式で表示するには、右端の「 Switch to issue log view」をクリックします。
問題の詳細
課題ページ は、まず問題を理解し、解決に必要な時間を最小限にするためのボトムラインの洞察を提供するように作られています。
課題ページ には以下のセクションがあります。
- 問題の詳細:このセクションには、ゴールデンシグナルと関連コンポーネントの2つの機械学習モジュールがあります。
- ラベルセット: ラベルセットは、AWS Cloudwatch、REST APIなどのサードパーティのソースから来るインシデントや、NRQLのクエリに焦点を当てています。ラベルセットは、キーと値のペアの形で提供されます。
使用決定
ノイズをさらに低減したり、インシデントの相関関係を改善したりするために、決定を変更またはカスタマイズできます。決定は、インシデントインテリジェンスがインシデントをグループ化する方法を決定します。
はじめに、 Decisions をご覧ください。