サーバー保守とは?業務内容や重要性、運用との違いについて詳しく解説
サーバーを安定的に利用し続けるためには、定期的なメンテナンスやトラブル時の迅速な対応を行う必要があります。このような作業をサーバー保守といいます。サーバー保守とはどのような作業であり、どのように実施していけばよいのでしょうか。この記事では、業務でサーバー保守を実施される方やサーバー保守を外注されたい方に向けて、サーバー保守について詳しく解説していきます。
サーバー保守とは
「サーバー」を「保守」するとはいったいどのようなことを意味するのでしょうか?まず初めに、サーバー保守の概要をご紹介します。
サーバー保守の概要
サーバー保守とは、サーバーが継続的に安定して動作するように、サーバー機器やサーバー上で動作するソフトウェアなどのメンテナンスを行ったり、サーバーにトラブルが発生した際に迅速に復旧させたりする作業を指す言葉です。
システムの稼働やWebサイトの公開に利用するサーバーは電子機器であり、部品が故障したり、バグによりエラーを起こしたりといった理由で動作不良が発生します。動作不良の可能性をできるだけ下げ、安定してシステムを利用したり、Webサイトを公開したりできるように、サーバー保守を行います。
サーバー運用との違い
サーバー保守と似た言葉に「サーバー運用」というものもあります。両者を合わせた「運用保守」という言葉を聞かれたことがある方も多いかもしれません。運用と保守にはどのような違いがあるのでしょうか。
両者を端的に区別すると「日々行う作業かどうか」というものです。サーバーの監視やバックアップの取得などといった定期的な業務が中心であるサーバー運用に対して、機器の故障対応やアップデート作業などといった非定期的な業務が中心であるサーバー保守という大まかな違いがあります。ただし、サーバー保守業務にも一部定期的なメンテナンス作業などが含まれます。
しかしながら、運用と保守に明確な違いはありません。システムの世界では保守と運用は「運用保守」としてひとまとめにされることも多く、一人のエンジニアが運用と保守どちらも対応するケースも珍しくありません。よって、運用と保守を厳格に分けて捉える必要はなく、どちらもサーバーを利用するために必要な作業であると考えておきましょう。
なぜサーバー保守を行う必要があるのか
なぜサーバー保守を行う必要があるのでしょうか。サーバー保守を行わないと、どのようなリスクがあるのでしょうか。以下では、サーバー保守を行う理由についてご紹介します。
業務停止を避けるため
ひとつは、システムが利用できなくなることで業務が停止してしまうリスクを避けるためです。
サーバー保守はサーバーを安定的に稼働させるために行います。保守作業を怠ると、機器の故障を検知できずシステムが停止してしまったり、データが消失してしまったりといった事態に発展することもあります。サーバー保守によりサーバーの停止リスクを減らし、業務停止といった最悪の事態を発生させないようにします。
サイバー攻撃の予防のため
サイバー攻撃に対する備えとしてもサーバー保守は重要です。システムの宿命として、時間の経過とともにセキュリティホールが発見されやすくなり、悪意のある攻撃者から狙われやすくなってしまうという問題があります。サーバー保守作業を通して、サーバーを常に最新の状態とし、セキュリティ強度を高める必要があります。
よくあるのが、サーバーにインストールしているソフトウェアの脆弱性を狙って攻撃を受けるケースです。サーバー保守作業として脆弱性を解消するためのパッチあて作業を行うことで、このようなリスクを減らすことができます。近年では「ゼロデイ攻撃」として脆弱性が公表された日に攻撃を受けるリスクも高まっています。このような攻撃を防ぐためにも、サーバー保守として迅速なパッチあて作業が必要です。
レピュテーションリスクを回避するため
現代のビジネスでは、システムを利用しないでサービスを提供するケースは稀です。どのような業種・業態においても、何らかの形でシステムが利用されています。このような状況では、システム停止時には企業に甚大な影響を与えます。
サーバーが突発的に停止してしまうと、企業はサービスの提供が困難となり、企業の評判は大きく毀損されます。レピュテーションリスクを回避するという観点でも、サーバー保守により安定的にサーバーを継続稼動させることが重要です。
平常時のサーバー保守の業務内容
具体的に、サーバー保守ではどのような作業を行うのでしょうか。以下では「平常時」と「トラブル時」の2つに分けて、サーバー保守の業務内容をご紹介します。
まず、平常時のサーバー保守業務については以下のとおりです。
定期的なメンテナンス
サーバーを安定的に利用し続けるためには、定期的なメンテナンスが必要です。一般的には以下のような項目を点検しつつ、問題がある場合には機器の交換やソフトウェアのアップデート等を行います。
・機器のランプ点灯状況の確認
・機器の起動状況の確認
・各種ドライブの動作確認
・モニター、キーボード等の外部機器の動作確認
・UPS(無停電電源装置)の動作確認 など
たとえば、ハードディスクのランプが点灯していなかったり、警告を示す点灯をしていたりしたら、何らかトラブルが発生していると考えられます。この場合、ハードディスクの交換を行い、データ消失を未然に防ぎます。
アップデート計画・実行
サーバー上で動作するソフトウェアについては、都度アップデート作業を行う必要があります。一般的にソフトウェアベンダーは今後のアップデート計画を公表していますので、この計画を踏まえサーバー上で動作しているソフトウェアに対するアップデート方針を検討します。
最も影響が大きいのがOSのアップデートです。WindowサーバーにおいてはWindows OSの、Linuxサーバーにおいては各種Linux OSの保守期間を確認し、保守期間内に必ずアップデートを行うようにします。
また、新たにソフトウェアに対して脆弱性が発見されたケースなど、計画外でアップデートが行われることもあります。計画外のアップデートがあった場合には、その内容を踏まえて自社のサーバーに適用するかどうかを検討します。
バックアップ計画・実行
バックアップについては運用作業の範疇に含まれることも多いですが、保守作業として実施することもあります。
まず、バックアップをどのような頻度で、どの情報を対象に行うかといったバックアップ計画を検討します。一般的にバックアップ計画はシステムの構築時に併せて検討されることが多いですが、保守フェーズに入った後もコスト最適化やデータの消失防止のために継続的に見直しを行います。
バックアップ計画に基づき、日々のバックアップ作業を行います。近年では自動でバックアップデータを作成する仕組みとなっているシステムも多いですが、一部のシステムでは手作業でサーバーのデータをコピーし、ディスク等に保管することとなります。
ドキュメント整備
保守作業を行うために重要となるのがドキュメントです。保守の品質を高めるためには、作業マニュアルに沿って作業を行うことがポイントです。そのためには、事前に作業内容をドキュメント化しておく必要があります。
ドキュメントの整備についても一般的にはシステム構築時に行うこととなりますが、環境変化などに合わせて都度見直しを行っていく必要があります。たとえばOSのバージョンアップを行えば、当然作業マニュアルの見直しが必要です。
保守切れ対応
電子機器であるサーバーは永続的に利用できるものではなく、一定の利用年数が過ぎると入れ替えを行う必要があります。多くのベンダーでは、サーバーの保守期間を5年としています。購入後5年間が過ぎたサーバーについてはそのままでは動作が保証されないため、何らかの対応を行う必要があります。
保守切れ時には、一般的には「新しいサーバーへの入れ替え」「延長サポートの検討」「第三者へのサポート依頼」といった方法から対応を選択することとなります。これらの方法について、詳しくは以下の記事で解説していますので、併せてご覧ください。
※関連記事:サーバーの保守期限とは?一般的なメーカーのサポート期間を紹介
トラブル時のサーバー保守の業務内容
トラブル時の復旧速度は企業の収益に直結します。トラブル時の対応は、サーバー保守における重要な業務といえるでしょう。
以下では、トラブル時に行う業務内容について詳しくご紹介します。
状況把握・影響範囲の特定
トラブルが発生した際には、まず状況の把握を行います。どのようなトラブルが起きているのか、誰に影響があるのかといった情報を収集し、今後の対応を検討します。
トラブル対応の初動で何より重要なのが、関係者への情報周知です。特にユーザーへの情報周知は優先して行います。まずはユーザーに対して「現在システムにトラブルが起きています」という情報を伝え、復旧対応を進めていることを認知してもらいます。これにより、ユーザーの不満を和らげることができます。
原因究明
次に、トラブルの原因を特定します。トラブルが検知された場所と、原因となっている場所が異なることもよくあります。ネットワークが問題なのか、サーバーやストレージが問題なのか、まず原因となっている場所を切り分けます。
次に、より詳しく原因を究明していきます。結果として、たとえばあるサーバーのアプリケーションに問題があり処理がストップしてしまったなど、トラブルの原因が明らかとなります。
暫定対応
原因が明らかとなったら、まずは暫定的な復旧対応を行います。トラブル時には素早くシステムを再稼働させ、ユーザーが利用できる状態に戻すことが重要です。
システムが復旧できたら、ユーザーに情報を周知します。これにより、ユーザー側も安心してシステムを利用することができます。
原因分析・恒久対応
暫定的にシステムが復旧できたとしても、それで対応を終わりにしてはいけません。必ずトラブルが起きた原因を分析し、再発を防止できるようにします。原因分析の結果、たとえばアプリケーションに対するテストが不十分であることがトラブルの原因だったとしたら、テスト方法を見直すなどの改善を行います。
また、暫定的に稼働させていたシステムに対して、恒久対応を行います。恒久対応とは、トラブルの原因を完全に解消することです。たとえば暫定対応として手作業でのデータ登録などを行っていた場合、恒久対応で自動化を行います。これにより、システムを安定的な稼動状態に戻します。
サーバー保守の実施方法
サーバー保守を実施する方法には、大きく以下の3つが挙げられます。
自社要員で実施
自社要員でサーバー保守作業を実施する方法です。社内にエンジニアがいる場合、自社で利用しているサーバーは自社で管理するのが合理的です。自社要員でサーバー保守を実施することで、問題があった際にすぐに対応できる安心感を得られます。また、ノウハウが社内に蓄積されていく点もメリットです。
ただし、あまりにも管理すべきサーバーが多い場合には自社要員だけでは管理が難しくなります。また、必ずしも社内にエンジニアがいる企業ばかりではありません。その場合、後述する外注についても検討します。
保守契約による外注
サーバー保守を実施してくれる企業と契約を締結し、保守作業を実施してもらう方法です。社内にサーバー保守を担う人材がいない場合や、サーバー保守に関するノウハウが無い場合に、有効な手段となります。
特にトラブル対応については、24時間365日いつでも実施できるようにしなければなりません。自社要員では、どうしても休日対応や夜間対応が難しくなります。豊富に人材を抱えている外部企業に作業を委託することで、休日対応を含めてトラブル対応を行ってもらいやすくなります。
スポットでの依頼
定期的に作業を実施してもらうのではなく、スポットで外部企業に作業を委託することもできます。サーバーの部品交換やトラブル時の対応など、作業を依頼したい場合にのみ外注で作業を依頼することで、コストを削減することができます。
ただし、スポットでの依頼だとどうしても作業依頼までにリードタイムが必要です。特にトラブル対応については時間的な猶予が無いことも多いですが、スポットでの依頼だと迅速な対応は難しくなります。よって、スポット対応でサーバー保守を依頼する方法は、重要度やサービス停止リスクが低いシステムに向く方法だといえます。
それぞれの方法をまとめると以下のとおりです。
・社内にエンジニアがいる場合、自社要員でサーバー保守を実施する方法を検討します。ただし、管理するサーバー台数が増えてくると自社要員での対応が難しくなることもあります。
・社内にエンジニアがいない場合や、社内要員でサーバーを管理しきれない場合は、外注を検討します。外注には「保守契約による外注」と「スポットでの依頼」という2つがあります。
・重要度の高いシステムや、トラブル時の停止リスクが高いシステムについては、迅速な対応が期待できる保守契約による外注が有効です。一方で、重要度が低く保守コストを抑えたいシステムであれば、スポットでの依頼で十分であるケースもあります。
まとめ
この記事では、サーバー保守について詳しくご紹介しました。システムを安定的に利用できる状態とするには、サーバーの定期的なメンテナンスやトラブル時の対応といったサーバー保守作業が必要となります。サーバーを購入したり、レンタル・リースでサーバーを利用したりする場合には、サーバー保守が必要である点をまず押さえておきましょう。
また、サーバー保守を実施する方法には大きく「自社要員で実施」「保守契約による外注」「スポットでの依頼」という3つが挙げられます。自社の人員やノウハウ、システムの特性に応じて、最適な方法を選択しましょう。