今日を知り、明日を変えるシステム運用メディア

クラウドの障害対応支援サービスとは?メリットや選ぶポイントも解説!

クラウドの障害対応支援サービスとは?メリットや選ぶポイントも解説!

企業が利用しているクラウドサービスで障害が発生すると、提供するサービスの停止が引き起こされます。機会損失や顧客満足度の低下にもつながるため、障害発生時のサービス停止時間は最小限にすることが求められます。しかし、クラウドを利用したシステムの制作のみをベンダーに依頼している場合、社内に専門家がおらず急な障害に対応できない可能性もあるでしょう。そこで最近、利用が広がっているのがクラウドシステムの監視・障害対応支援サービスです。専門家がシステムの稼働状況を監視し運用を代行するとともに、障害発生時には対応を行います。

「障害対応支援サービスってどんな内容?」

「利用することでどんなメリットがあるの?」

こういった疑問に答えるため、この記事ではクラウドで発生する障害の概要、障害対応を支援してくれるサービスについて、支援を導入するメリット、支援サービスを選ぶポイントを解説していきます。

クラウドの利用を既に始めている、または現在検討している企業の方は、この記事を読めば障害対応をアウトソーシングできる支援サービスについて詳しく知ることができます。クラウド利用には障害対策が欠かせません。障害対応サービスを有効に活用して、クラウドを自社のビジネスに最大限活かしましょう。

クラウドサービスには障害が発生する

クラウドサービスには障害が発生する

AWSやAzureなど、現在のクラウドサービスの多くでは高い可用性が保証されています。可用性とは「システムが継続して稼働できる度合い」を示しており、高い可用性は有事の際でも変わらず利用できることを示しています。

しかしどれだけ高い可用性を保証しているクラウドサービスでも、絶対に障害が発生しないわけではありません。障害発生率が0%となることは無く、必ず障害を前提としています。AWSの障害管理に関するドキュメントでも、冒頭で以下のように記述されています。

障害は発生するものであり、最終的にはすべてが時間の経過とともにフェイルオーバーします。つまり、ルーターからハードディスクまで、TCP パケットを破壊するオペレーティングシステムからメモリユニットまで、そして一時的なエラーから永続的な障害まで、どれもが対象となるのです。これは、最高品質のハードウェアを使用しているか、最低料金のコンポーネントを使用しているかにかかわらず、当たり前のことです – Werner Vogels、CTO – Amazon.com

ー引用元:AWS Well-Architected フレームワーク「信頼性の柱障害管理」

このように障害が発生することは、クラウドサービスの前提ともいえるリスクです。障害の発生自体を完全に避けることができない以上、対策は必須となります。

障害の代表的な原因

障害が発生する原因はさまざまで、代表的なものには以下のような例が挙げられます。

人為的なミス

サーバーを管理する提供元か、サービスを利用する企業側のどちらかで、メンテナンス担当者が誤った操作を行った場合に発生します。入力したコマンドの誤りなどによってサーバーがダウンしたり、通信が正常でなくなったりすることで障害につながります。

想定外の過負荷

システムが想定していないレベルの過負荷にさらされた場合に障害が発生するパターンです。多くのサービスでは過負荷の対策が取られていますが、その許容量を超えた負荷がかかった場合に、システムが対応しきれず発生します。通信の中断やサーバーのダウンが引き起こされる可能性があります。

サーバー冷却装置の故障

データセンターでサーバーを冷却している装置が故障した場合に障害が発生するパターンです。高熱を発するサーバーを冷却できず、サーバーがオーバーヒートを起こすことでダウンし、障害に発展します。物理的な修理やオーバーヒートしたサーバーの点検などが必要になる場合があります。

天災

データセンターのある地域が豪雨や地震などの天災による被害を受けた場合に発生します。停電が起こるか、サーバー等のハードウェアが損壊することで、サーバーが正常に動作できず、アクセス不可になります。地域単位の災害による障害となるため、復旧に時間を要する場合がある点に注意が必要です。

障害の対応を支援してくれるサービス

障害の対応を支援してくれるサービス

障害が発生したとき社内に対応できる人材がいなければ、正常にサービスが提供できない状態が長引いてしまいます。ベンダーと前もって契約を交わしていない場合も同様で、障害が発生してから依頼しても、障害解決の対応に着手するまで時間がかかってしまいます。

障害が長引くことにより想定される影響は、システムが社内向けなら業務の遅延や停止、顧客向けなら売上の損失やレピュテーションの低下などです。いずれの場合も影響は小さくないため、前もっての対策が必要です。

そこで、障害対応のアウトソーシングとして支援サービスが存在します。多くの支援サービスではクラウドサービスの監視を行い、障害発生時にその原因の究明と復旧作業を実施します。専門的な知識と技術を持ったスタッフが対応するため、障害の発生時でも安心して任せることが可能です。サービスで対応できる範囲や代行できる内容は、サービス提供元により異なります。

支援サービスを導入するメリット

支援サービスを導入するメリット

障害対応を含めた運用支援サービスを導入することで、企業には多くのメリットがあります。ここからは、その代表的なメリットをくわしく解説していきます。今後クラウドを利用するうえで、以下に示すメリットがどのような効果を持つか考えながら、支援サービスの内容を把握していきましょう。

専門家が対応してくれる

支援サービスの最大のメリットが、専門家による対応を受けられる点です。「支援サービスだから当然」と思われるかもしれませんが、障害発生時を想定した場合はこのメリットが大きな意味を持ちます。

システム障害では、原因の切り分けから解決策の実施までのスピード感が重要です。迅速に障害を取り除くことはもちろん、原因を踏まえた最適な手順での実施には、専門的な知識とノウハウが必要になります。この点で専門家の対応を受けられることは、大きな利点です。社内に人材を育成するコストを考えれば、最初から知識・ノウハウを持っている専門企業にアウトソーシングする方が、コスト面でも最適といえるでしょう。

常にシステムを監視できる

障害対応を支援するサービスの多くは、システムの運用・監視をセットでサポートしています。これにより企業のシステムを、常に監視状態に置くことができるようになります。障害の発生の他にも、システムの動作やキャパシティの状態などが把握できるようになり、最適化のきっかけとすることが可能です。

専門の部署や人員無しでシステムの常時監視を行うのは難しく、監視や見直しを行えないケースも多くあります。そこで支援サービスを導入すれば、サービスに含まれた常時監視や最適化支援の恩恵を受けることができます。効果的に利用できれば、コスト削減やシステムの効率化を図ることが可能になるでしょう。

迅速に解決が目指せる

障害の発生と解決において、最大のポイントは迅速な障害の解消です。障害の発生から解決までの時間が長引けば、それだけシステムの停止時間が長くなり、業務や自社サービスの提供に支障が生まれます。損失を最小限にするためには、迅速な障害の解決が欠かせません。

しかし前述の通り、障害発生時に社内に専門家が不在またはベンダーとの契約が無い場合、発見から解決には時間を要します。

障害対応支援サービスは、常時監視により即座に障害を見つけ出し、その時点から原因の切り分けを行います。また、解決の過程もシステムの知識をもった専門家が実施するため、対応フローがより的確です。スムーズな対応で迅速に解決を目指すことができ、有事の際も早急にシステムの回復が期待できます。

コストが抑えられる場合がある

支援サービスを導入することで、総合的なコストが削減できる場合があります。支援サービスはテクニカルサポートの一環で、現在のシステムの設定やコストパフォーマンスを最適化するサポートを行っているケースがあるためです。これを利用することで、継続的に発生するクラウド利用のコストを抑え、システムの最適化によって業務の事務コストが削減できる可能性があります。ただし、システムの運用・障害対応支援サービスは、提供元ごとにオプションや対応するサポートの内容が細かく異なります。導入の際は、サポート内容にも注意してサービスを選択することが必要です。

サービスを導入するという点で増加する費用だけに目を向けるのではなく、システム全体で抑えられる金銭的・事務的コストの減少も考慮してみましょう。

支援サービスを選ぶポイント

支援サービスを選ぶポイント

クラウドに関する支援サービスは提供元によりさまざまな違いがあります。多くの企業がサービスを提供しているため、選ぼうとしてもどれが最適か悩む部分があるかもしれません。そこでここからは、支援サービスを選ぶ際のポイントを解説していきます。

障害対応の支援を中心に、総合的な支援力が高いサービスを見分けるために欠かせないポイントをまとめています。以下に示す4つのポイントを踏まえつつ、企業の性質や条件に合わせてサービスを選定していきましょう。

24時間365日体制である

いつクラウド環境のシステムに障害が発生するかは、まったく予想がつきません。そのため障害対応支援サービスは、24時間365日体制を提供しているものが推奨されます。その中でも監視だけでなく、障害発生時の復旧対応完了まで同じ体制を実施しているものを選びましょう。サービスによっては監視や一次対応のみ24時間365日体制としている場合があります。この場合、提供元の稼働開始まで復旧が遅れる可能性が出てしまうため、望ましくありません。

監視や障害対応に対する支援体制については、必ず要件定義や設計検討の段階で確認することができます。また、各社が提供する支援サービスを紹介しているウェブサイト上にも、支援体制が掲載されている場合があります。それらの情報を確認して、24時間365日体制を保証しているサービスを探してみてください。

障害対応支援サービスを導入するからには、常に緊急の状況に対応できるサポート体制を提供しているサービスを利用しましょう。

システムや利用コストの最適化がセットになっている

支援サービスは、テクニカルサポートの一環としてシステムやクラウド利用コストの最適化が含まれているものを利用しましょう。「支援サービスを導入するメリット」でも記載した通り、これにより総合的なコスト削減につながる可能性があるためです。

システムの最適化は利用年数に応じて必要性が増す一方で、後回しにされがちです。これは全体を一新するコストや、使い慣れてしまったシステムを変更することへの抵抗が主な理由となります。しかし、日々新しくなる技術によって、よりコストパフォーマンスの良いシステムやセキュリティレベルの高い構成に更新されるのが、システムの世界です。そのため最適化を先延ばしにすれば、無駄の多いシステムとなるだけでなく、セキュリティ面でも脆弱性が高まります。

支援サービスに付帯するテクニカルサポートによって、専門家の視点で最適化が行えます。コスト削減だけでなく、システムの最新化によるセキュリティレベルの向上に繫がるケースもあるため、積極的に利用したいサポート内容です。長期的なクラウド利用を考慮して、システムの最適化がセットになっている支援サービスを探してみてください。

対応完了時間の目安がある

先述した通り、障害解決の重要なポイントは迅速な障害の解消です。可能な限り早い障害解決は障害対応支援サービスの要ともいえます。そこで、より具体的な指標として対応完了時間の目安が提示されるサービスを探してみましょう。

対応完了目標として「この工程で対応開始から〇〇分で報告」や「〇〇分以内に対応を完了」といった具体的な数字があれば、支援を受ける側としても安心です。障害の検出や原因の切り分けなど、段階ごとに対応時間の目安が提示されている場合もあります。

対応完了時間の目安は、支援サービスを選ぶうえで必須の条件というわけではありません。しかし、詳細な障害対応手順を確立していることの確認にもなるため、利用するサービスの水準を把握することが可能です。

こういった対応完了時間の目安は、サービスを紹介するウェブサイトなどでは公開されていないケースも多くあるため、問い合わせで確認するのがおすすめです。その他の要件と合わせて確認し、サービスごとに設定されている時間の目安を比較してみましょう。

監視・障害情報のレポートがある

監視や障害対応支援を行う過程で起こったことや、ナレッジとして有用な情報をまとめたレポートを提供してくれるサービスも存在します。レポートはその先の支援サービスに活用される他、企業側でもシステムの最適化に利用することが可能です。

実際の運用の中で得られたデータは、そのシステムを最適化するうえで最も役に立つ情報といえます。企業はこの情報を元に、支援サービスの提供元やクラウド環境を提供したベンダーと最適化を進められるようになります。

また、障害の傾向や発生しやすいアラートを運用に落とし込むことができれば、平時の運用の効率化も可能です。提供元によってはレポートを元に運用手順の改善案を提示してくれるサービスもあるため、利用する側である企業の運用状況も鑑みて、支援サービスの要件に加えてみましょう。

まとめ

クラウドで障害が発生しても、障害対応支援サービスがあれば対応を専門家に任せることが可能です。また、多くの支援サービスは監視や運用支援とセットになっており、その他のメリットによるシステムの最適化が合わせて期待できます。メリットを最大限受けるには、自社に合ったサポート内容を提供している支援サービスを見つけることが必要です。より安全で障害に強いシステムを運用するため、本記事で紹介した支援サービスを選ぶポイントを参考にしてみましょう。

本記事では、クラウドで発生する障害の概要、障害対応を支援してくれるサービスについて、支援を導入するメリット、支援サービスを選ぶポイントを解説してきました。

クラウドサービスを利用する企業の方は、この記事の内容を活用して自社に最適な支援サービスの要件を検討してみてください。この記事をご覧になったあなたの参考となれば幸いです。

人気の記事

最新情報をお届けします!

最新のITトレンドやセキュリティ対策の情報を、メルマガでいち早く受け取りませんか?ぜひご登録ください

メルマガ登録