【サーバー監視とは?】最も基本的な2つの注意点、監視方法について徹底解説

目次
      1. サーバー監視とは?
      2. サーバーにおける“監視”と“運用・管理”の違いとは?
      3. サーバー監視の主な機能2種
      4. サーバー監視の重要性とは
      5. サーバー監視の方法
      6. サーバー監視をする場合の知っておきたい2つの注意点
      7. サーバー監視の主要3項目
      8. まとめ

 


サーバー監視とは、利用者向けにサービスを提供するソフトウェアが稼働しているサーバーが、正常にその目的を達成できる状態かを確認することです。

サーバーにトラブルが発生した場合、利用者の業務が滞り、製品・サービスの信頼性を損なう等の大きな損失に繋がりかねません。そのため、サーバーを適切に監視するための監視設計、適切なツールの選定、運用する体制を整えることは非常に大切です。
つまりサーバーによる顧客と企業、双方の不利益を最小限に抑えるために欠かすことができないのが「サーバー監視」です。

この記事では、サーバー監視とは何か、目的や方法、注意点などについて詳しく解説します。

1.サーバー監視とは?


サーバー監視とは、システムにトラブルが発生しないよう、サーバーが正常に稼働しているかを監視することです。
その目的は、サーバーが提供するサービスの品質を確保し、利用者に不利益をもたらさないようにするためです。

よく、サーバー監視というと、CPU使用率やメモリ使用率を定期的に確認することが挙げられます。確かにそうしたキャパシティプランニングを目的にした監視も必要ですが、一般的にこうした監視が多いからという理由で実装することにあまり意味はありません。

例えば、CPU使用率が80%を超えた場合に障害として通知しますという監視を実装したとします。リソースが80%も消費されているということは、枯渇しそうに思えます。しかし、そのサーバーがリソースを効率的に使用できていることでCPU使用率が80%になっており、それが顧客体験に何等影響を及ぼしていない場合、これは障害でしょうか?

重要なことは、利用者側に不利益がでる状況を把握し、その状況を未然に防ぐ、あるいは即時に検知するための監視です。そのため、本来監視はサーバーだけに行われるというよりも、システムの環境全体に対して実装されます。

2.サーバーにおける“監視”と“運用・管理”の違いとは?


サーバーに関する業務として「運用・管理」という言葉が使われることもあります。
厳密な定義があるわけでは無いですが、サーバー運用やサーバー管理はより広い言葉として使われることが多く、監視も内包されているケースが少なくありません。

運用・管理という言葉には継続的・安定的稼働を実現するための一切の業務を含むことが多いため、例えば以下のような業務を包括して示されるケースが多いです。

【サーバー運用・管理の概要】
●  ハードウェア保守
●  障害検知や復旧業務作業
●  対応手順のマニュアル化

3.サーバー監視の主な機能2種


サーバー監視を実現するための主な機能2種類を紹介致します。
基本的に、市場に存在する監視ツールはこの2種類の機能を満たしたうえで、対応する監視方法や監視内容、収集したデータのグラフ表示機能、サポートサービス等で差別化が行われています。

【2つの必須機能】
●  監視機能
●  通知機能

それぞれについて詳しく見ていきましょう。

①監視機能

当たり前と思われるかもしれませんが、一つ目は監視機能です。サーバーの性能やログ情報を一定間隔で収集し、収集した情報に対して異常/正常の判定を行う機能です。判定の仕組みは監視ツールに依存しますが、取得した際の瞬間値だけでなく、一定期間に収集されたすべてのデータを判定に活用することも可能です。多くの監視ツールでは取得した情報をデータベースに保存する機能があるため、過去の情報を参照する機能が実現できています。

また、「過去3カ月のデータをグラフで可視化して、傾向を確認したい」というような要望が運用で発生することはあると思います。データをどの程度保存しておけるかは、ツール選定において重要な要素の一つでもあります。

②通知機能

サーバーの異常を検知した際に、適切な対応を行うために発報する通知機能です。例えば異常な値を検知すると、メールで担当者へ通知をしたり、パトライトを点灯させたりします。

この機能により障害を担当者がすぐに適切な対応を行うことができ、サービスへの影響を最小限に抑えられます。しかし、心配だからという理由で何でも通知をしてはいけません。不必要な通知は、担当者に余計な負担をかけることになります。休日や深夜でも通知がくるようですと、担当者の気持ちが休まる間もありませんよね。

通知機能も監視ツールにより様々ですが、最近ではチャットや電話、簡単な自動復旧スクリプトの呼び出し等、様々な連携が用意されています。

4.サーバー監視の重要性とは


ここまで説明してきた通り、サーバー監視はシステム運用において非常に重要です。しかし昨今、サーバー監視に限定した場合、その重要性は低下しています。

その大きな理由が、従来のサーバーとは異なる特徴をもったクラウドサービスの普及です。総務省の「令和3年通信利用動向調査の結果」によると、クラウドサービスを導入する企業は2021年時点で約7割を超えました。そのクラウドサービスでも、利用形態に応じて監視は必要となります。

しかし、IaaSの代表であるAWSでは「AutoScaling」という負荷状況に合わせて自動でインスタンス(クラウド上の仮想サーバー)の数を変動させる機能があり、自動でサーバーのスケールアウト/スケールイン(増減)が頻繁に生じるため、インスタンス個別での追跡は困難です。またクラウドベンダーが提供するサービスでは、利用者が操作できる範囲も限られています。必然的に監視できる要素には限りがあります。

このようなことから、クラウドサービスが普及した今、サーバー単体を監視するだけではサービス影響を把握することが難しくなっており、システム全体での監視に重点を置く必要性が高まっているのです。

5.監視の方法


サーバー監視は、必ずしも自社で行わなければならない訳ではありません
ここでは、自社で行う場合と外注する場合、それぞれの監視方法について詳しく見ていきましょう。

①自社で行う場合

自社で監視を行う場合には、監視を行う人材を社内に確保し、自社で監視プロセスの全体を完結させます。監視にあたっては、一般的に専用の監視ツールを使用します。

自社で行うメリットとして、自社のシステムに対する迅速な障害対応が可能なことや、改善活動において組織内部でのコミュニケーションが容易であることが挙げられます。

しかし、障害対応は情報システム部門が担うことが多く、24時間365日稼働するサービスで夜間に障害が発生した際には対応しきれなくなるというような体制の問題もあります。

また、監視ツールの運用は専門知識が求められる重要な分野ですが、より重要となるのが前段の監視設計です。監視設計を正しく適切に行うためには、システム全体に対する知識や、それを監視設計に落とし込む技術が必要です。

②外注(アウトソース)で行う場合

前節で説明した通り、監視は24時間365日での対応や、高度な技術力と経験が求められます。
そこで採りうる選択肢のひとつが、専門的な事業者に外注することです。

外注するメリットとして、24時間365日の監視体制を自社のリソースで負担しなくて済むこと、そして高い専門性をもつベンダーに頼ることで監視の質を担保できることがあげられます。

一方のデメリットとして、外注先取引が長期化するほど監視設定などを自社で把握することが困難になり、監視のブラックボックス化による外注先への依存が考えられます。

リスクの軽減策としては、外注先に任せきりにならず、設計書や監視パラメーターシートを自社でも保管し、定例会や月次の報告会を業者と行うことで主体的にコントロールしていくことが大切です。

6.サーバー監視をする場合の知っておきたい2つの注意点


前章にて監視方法について自社での対応とアウトソースについてご紹介いたしました。その他にも、サーバー監視にはいくつかの注意点があります。

【サーバー監視の注意点】
●  自社で対応する場合、監視にかかる費用に注意
●  外注する場合、情報漏洩リスクがある

それぞれの注意点について詳しく見ていきましょう。

①自社で対応する場合、監視にかかる費用に注意

自社で監視する場合の注意点は、費用の高さです。
自社での監視を始めるためには監視サーバーの準備にかかる工数やライセンス、監視のための環境構築、そして運用、社内体制の改変等にコストが発生します。監視業務は重要であることは理解しつつも、それ単体では収益に貢献しない業務になるため、費用を抑えて対応したいと考える企業様も多いことでしょう。

コスト面だけを考えるのであれば、自社のリソースでは手に余るといった一定のシステム規模からは、専用の体制と設備を有するベンダーへの外注を検討することが有効です。

②外注の場合、情報漏洩リスクがある

監視を外注する場合の注意点は、情報漏洩の危険性です。監視に限らず、アウトソーシングのデメリットとして、会社の機密情報の漏えいリスクがあります。

そこで重要となるのが、外注先がセキュリティや個人情報取り扱いに関する適切な取り組みが行っているかどうかです。外注の際、契約における取り決めも大切ですが、情報漏洩のリスクを軽減するために当該企業が情報資産に対してどのような取り組みをしているかも確認するべきポイントです。例えば、情報セキュリティマネジメントシステム(ISMS)を有しており、情報セキュリティを管理していく仕組みがあるか、等を確認すると良いでしょう。

7.サーバー監視の主要3項目


サーバー監視における監視対象は多岐にわたります。
ここではサーバー監視で代表的な以下3つを紹介します。

【サーバー監視における3つの項目】
● 死活監視
● リソースの利用状況
● ログファイル

①死活監視

死活監視にはいくつかの種類があり、一般的な死活監視というとサーバーの生死(死活監視)、いわゆるサーバー本体が稼働しているかどうかの監視を差します。その他、サーバー上でサービスやプロセスが生きているかどうかという、アプリケーションの死活監視もあります。

サーバーが正常に起動しているか、アプリケーションが想定通りに起動しているかを確認することは、サービス品質維持のために欠かせない項目となります。

②リソースの利用状況

次に挙げられるのがリソースの利用状況の監視です。OSのCPUやメモリ、ディスクの使用率などが上がり過ぎると、応答の遅延やアプリケーション停止、あるいはファイル破損に繋がる可能性があります。また、リソース監視では設計したマシン性能を正しく利用できているか、枯渇が生じていないかということを長期にわたり観察するために実装されることもあります。

そのため、各監視対象のリソースに閾値を設定する際には、増加傾向にあるかどうかを把握するために「二段階発報」の仕組みを実装することが多いです。一段階目では警告域としてやや低めの値にし、二段階目に障害域として高めの値を設定する等で、段階毎に通知や対応方法を変えて運用するケースがみられます。

③ログファイル

3つ目がログファイルの監視です。ログファイルとは、稼働中にサーバー内で起きた情報が時系列で記録されたファイルのことです。ログファイルを監視することで、リソース利用状況でも表れないような内部で発生した不具合を検知できるようになります。

死活監視やリソース監視と組み合わせて実装することで、障害が生じた際の原因特定にも役立ちます。

8.まとめ

この記事では、サーバー監視について詳しく解説しました。システムを安定して稼働させるために、サーバー監視は欠かせない要素です。自社でサーバー監視を行うこともできますが、リソース確保が必要な上に高い専門性も求められるため、適切な監視業務ができない可能性もあります。

そこでおすすめなのが運用監視のアウトソーシングです。外注(アウトソース)することでコストも抑えられるだけでなく、技術とノウハウをもった専門家により監視の質が担保されます。

弊社では独自の運用・監視センターで24時間365日の運用監視代行を行っています。「セキュリティ対策に不安がある」、「休日・夜間に作業を担当者の離職に伴い、専門知識が不足している」など監視でお困りのお客様は、是非お気軽にお問い合わせください。

 


クロス・ヘッド関連サービス

 


※Cloud Compassはクロス・ヘッド㈱が運営するクラウドサービスです。

おすすめ記事