Soracom

Users

ドキュメント
Home ドキュメント SORACOM Lagoon 3 Alert を管理する

Alert rule を設定する

監視するデータと、通知が必要になる基準 (評価基準) を設定します。また、通知先を表す Label も設定します。実際には、Label は Contact point と紐づけたり、Silence 対象を特定するための情報です。

  • Alert rule は、編集ユーザー (Editor ロール) のみが作成できます。閲覧ユーザー (Viewer ロール) では作成できません。ユーザーの違いについては、Lagoon ユーザーのロールを設定する を参照してください。
  • Alert rule の削除は、閲覧ユーザー (Viewer ロール) でも行えます。
  • 作成した Alert rule は Folder に保存されます。そのため、Alert rule に対する権限は、Alert rule が保存されている Folder に対する権限で設定できます。たとえば、Folder に対して Edit 権限を持つユーザーは、Alert rule の編集 / 削除ができます。Folder に対する権限を設定する操作については、Folder に対する権限を管理する を参照してください。

ステップ 1: Query および [Firing] にする条件を設定する

Query (監視するデータ) と、Alert の State が Firing に変化する条件を設定します。

  1. Lagoon コンソールにログイン して、[ (Alerting)][Alert rules] の順にクリックします。

    「Alert rules」画面が表示されます。

  2. [+New alert rule] をクリックします。

    「Add rule」画面が表示されます。

    Panel の種類を Time series に設定している場合は、[Alert][Create alert rule from this panel] の順にクリックすると、Panel の設定を利用して Alert rule を作成できます。

  3. [Lagoon managed alert] が選択されていることを確認します。

    Query で監視するリソースおよび系列を選択し、Expression でデータの再計算や集計、判定を行います。

    • [+Add query] をクリックすると、Query を追加できます。
    • [+Add expression] をクリックすると、Expression を追加できます。

    Query:

    監視するリソースおよび系列を設定します。

    項目説明
    Query の名前Query の名前を変更できます。この名前は、ほかの Expression で、この Query を参照するときに使用します。
    データソース (1 行目 1 項目)「Harvest (default)」を選択します。
    評価範囲 (1 行目 2 項目)

    「Alert の概要」で説明している評価範囲 を選択します。[From][To] を指定する場合は、どちらも「now」(現在時刻) を含む相対的な時間を指定します。

    相対的な時間を指定するときのフォーマット

    現在時刻から 30 秒前を指定する場合は、now-30s のように指定します。同様に、d (日)、h (時)、m (分) などの単位を使用できます。ただし、複数の単位を同時に利用することはできません (例: now-5m30s)。たとえば、5 分 30 秒を指定する場合は、now-330s (5 分 30 秒) を指定してください。

    リソースの種類 (2 行目 1 項目)

    リソース (2 行目 2 項目)

    データを評価するリソースの種類およびリソースを選択します。詳しくは、Query を設定する を参照してください。

    リソースは 5 つまで選択できます。複数のリソースを選択した場合の挙動については Alert rule の Query で複数のリソースを指定する を参照してください。

    データフォーマット (2 行目 3 項目)

    「Standard」を選択します。

    ここでは「Standard」だけが利用できます。「Table」と「Map」は利用できません。

    系列 (2 行目 4 項目)系列を選択します。

    Query を設定すると、選択した系列のグラフが表示されます。

    系列を選択したときに、想定したグラフが表示されない場合は、もう一度同じ系列を選択してください。

    Expression:

    データの再計算や集計を行い、数値の評価を行います。

    項目説明
    Expression の名前Expression の名前を変更できます。この名前は、ほかの Expression で、この Expression を参照するときに使用します。
    計算方法Expression で使用する計算方法を選択します。計算方法について詳しくは、Query を加工して新しい Query を作成する (Expression) を参照してください。
    [Series]Expression で計算した結果が表示されます。「Time series data」と表示されたときは、マウスポインターをあわせると、時系列データが表示されます。
    [Make this the alert condition]クリックすると、この Expression を Alert 条件として利用できます。ただし、時系列データは Alert 条件として利用できません。

    不要な Expression は削除できます

    不要な Expression の [] をクリックすると、削除できます。

  4. [Preview] をクリックします。

    データが更新され、Alert 条件が評価されて、Alert の State が更新されます。

    State説明
    NormalAlert 条件を満たしません。
    FiringAlert 条件を満たしました。

ステップ 2: Alert 条件の評価間隔を設定する

次に、Alert 条件の評価間隔を設定します。たとえば、1 分間隔で Alert 条件を評価し、Alert 条件を満たした後も 1 分 30 秒間継続して Alert 条件を満たしている場合に限り、State が Firing に変化するように設定できます。

  1. Alert 条件の評価間隔を設定します。

    項目説明
    [Evaluate every]

    Alert rule の評価間隔を入力します。Lagoon は、指定した間隔で Harvest Data のデータを取得して Alert を通知するかどうかを評価します。

    • 10 秒の倍数を入力してください (例: 1m)。
    • 単位の文字として、s (秒)、m (分)、h (時間)、d (日) を利用できます。
    Lagoon のプランごとに設定されている「データを取得する時間範囲」よりも長い間隔を指定してください

    Lagoon のプランごとに、データを取得する時間範囲が設定されています。プランについて詳しくは、SORACOM Lagoon 3 のプランとライセンスパック を参照してください。

    [for]Alert rule の継続時間を入力します (例: 1m30s)。たとえば、「1m30s」を指定したときは、Alert 条件を満たしてから、1 分 30 秒の間、継続して Alert 条件を満たした場合に、Alert の State が Firing に変化します。「0」を入力した場合は、1 回でも Alert 条件を満たした場合に、Alert の State が Firing に変化します。

  2. [Configure no data and error handling] をクリックして、以下の項目を設定します。

    項目説明
    [Alert state if no data or all values are null]

    「「データが無い」か「すべてのデータが null」 のとき」の動作を設定します。

    • Alerting: この Alert rule で作成される標準的な Alert と同じ Label が設定された Alert が作成されます。標準的な Alert と同一の Notification policy や Contact point を利用して通知する場合に選択します。
    • No Data: この Alert rule で作成される標準的な Alert とは異なる Label が設定された Alert が作成されます。標準的な Alert とは異なる Notification policy や Contact point を利用して通知する場合に選択します。
    • OK: この Alert rule によって作成された標準的な Alert が Resolved になります。

    設定ごとに「Alert rule の State」、「Query の State」、「作成される Alert」などが以下のように異なります。

    項目Alert rule の StateQuery の State作成される Alert に設定される主な Label (*1)Contact point に通知する際の種別
    AlertingFiringAlerting (Nodata)alertname={Alert rule の名前} grafana_folder={Alert rule が保存されている Folder の名前}Firing
    No DataNormalNodataalertname=DatasourceNoData grafana_folder={Alert rule が保存されている Folder の名前} rulename={Alert rule の名前}Firing
    OKNormalNormal (Nodata)- (*2)Resolved
    • (*1) 作成された Alert は、「Alert group」画面 で確認できます。また、Notification policy は、「Alert group」画面での表示に基づいて設定します。
    • (*2) Alert は作成されません。
    [Alert state if execution error or timeout]

    無効な Query を設定していたり、Lagoon 3 のシステムエラーなどが発生したときの Alert の動作を設定します。

    • Alerting: この Alert rule で作成される標準的な Alert と同じ Alertが作成されます。標準的な Alert と同一の Notification policy や Contact point を利用して通知する場合に選択します。
    • OK: この Alert rule によって作成された標準的な Alert が Resolved になります。
    • Error: この Alert rule で作成される標準的な Alert とは異なる Alertが作成されます。標準的な Alert とは異なる Notification policy や Contact point を利用して通知する場合に選択します。

    設定ごとに「Alert rule の State」、「Query の State」、「作成される Alert」などが以下のように異なります。

    項目Alert rule の StateQuery の State作成される Alert に設定される主な Label (*1)Contact point に通知する際の種別
    AlertingFiringAlerting (Error)alertname={Alert rule の名前} grafana_folder={Alert rule が保存されている Folder の名前}Firing
    OKNormalNormal (Error)- (*2)Resolved
    ErrorNormalErroralertname=DatasourceError grafana_folder={Alert rule が保存されている Folder の名前} rulename={Alert rule の名前}Firing
    • (*1) 作成された Alert は、「Alert group」画面 で確認できます。また、Notification policy は、「Alert group」画面での表示に基づいて設定します。
    • (*2) Alert は作成されません。

    詳しくは、Grafana documentation の No data and error handling (英語) を参照してください。

ステップ 3: Alert rule の詳細を設定する

以下の項目を設定します。

項目説明
[Rule name]Alert rule の名前です。ここで設定した名前は、「Alert rules」画面に表示されます。
[Folder]Alert rule を保存する Folder の名前です。
[Group]

Alert rule の Group の名前です。同じ Group に所属する Alert rule の [Evaluate every] は、自動的に同じ値が設定されます。

[Group] と Alert group は別の機能です
  • Group は、[Evaluate every] を共有するための設定です。
  • Alert group は、Alert rule によって作成された Alert をグループ分けして表示するための機能です。
[Summary and annotations]

Key-Value の方式で、Alert rule に任意の情報を登録できます。ここで登録した情報は、通知の本文などで利用できます。

  • 「Dashboard UID」と「Panel ID」を指定すると、メールで通知するときに Panel のスクリーンショットが添付されます。

    メールの例:

    Dashboard UID と Panel ID は、Dashboard を表示して Panel のタイトル → [Edit] の順にクリックしてEdit Panel 画面を表示すると、URL で確認できます。

    グローバルカバレッジの場合:

    https://g-v3.lagoon.soracom.io/d/{Dashboard UID}/dashboard-name?orgId=xxx&editPanel={Panel ID}
    

    なお、Edit Panel 画面で、[Alert][Create alert rule from this panel] の順にクリックすると、Dashboard UID と Panel ID が設定された「Alert rule」画面が表示されます。

ステップ 4: Label を設定する

Lagoon 3 では、Alert の State が Firing になったときに、Alert rule に設定される Label を利用して、通知する Contact point を特定します。また、Silence を利用する際に、Silence 対象を特定するためにも Label は利用されます。

たとえば、Contact point の場合は、severity=info のときの通知先と、severity=warning のときの通知先を変更できます。実際の通知先は Contact point で設定し、Label と Contact point を関連付けるのは Notification policy で設定します。

Alert の概要については、Alert の概要 を参照してください。

  1. 以下の項目を設定します。

    項目説明
    [key]新しいキーを入力して、Enter キーを押すか、既存のキーを選択します。
    [value]新しい値を入力して、Enter キーを押すか、既存の値を選択します。

  2. [Save] をクリックします。

Alert rule を削除する

不要になった Alert rule を削除します。

作成できる Alert rule の数はプラン / ライセンスパックによって異なります。詳しくは、SORACOM Lagoon 3 のプランとライセンスパック を参照してください。

  1. Lagoon コンソールにログイン して、[ (Alerting)][Alert rules] の順にクリックします。

  2. Group の [>] をクリックして、削除する Alert rule の [] をクリックします。

  3. [Yes, delete] をクリックします。

    Alert rule が削除されます。

Alert rule に対する権限を管理する

Alert rule に対する権限は、Alert rule が保存されている Folder に対する権限で設定できます。たとえば、Folder に対して Edit 権限を持つユーザーは、Alert rule の編集 / 削除ができます。Folder に対する権限を設定する操作については、Folder に対する権限を管理する を参照してください。

Alert rule の Query で複数のリソースを選択する

Alert rule の Query で複数のリソースを選択すると、1 つの Alert rule で、複数のリソースに対して同一設定の Alert 条件を一括で作成できます。

Alert rule の Query で複数のリソースを選択したとき、Expression はそれぞれのリソースのデータに対して個別に適用されます。各 Expression の動作については Query を加工して新しい Query を作成する (Expression) を参照してください。以下は動作の例です。

  • Reduce の「Min」関数を使用すると、Query で選択したリソースそれぞれの最小値が出力されます。
  • Threshold を使用してデータとしきい値との比較を行うと、選択したリソースそれぞれについて判定が行われ、真偽値 (非該当で 0、該当で 1) が出力されます。
選択したリソース同士を使った計算する場合は、複数の Query を使ってください

1 つの Query で複数のリソースを選択したとき、選択したリソースのデータ同士を使った計算はできません。たとえば 1 つの Query で Device-1Device-2Device-3Device-4 をリソースとして選ぶと、Expression を使っても各 Device のデータの合計値や平均値は計算できません。4 つの Device のデータの合計値や平均値を計算するには、それぞれの Device から温度を取得する Query を個別に作成し、Expression Math を使ってください。