推奨される取り組み

25 障害対策

設問

万が一システムに障害が発生しても、必要最低限のサービスを維持できるようにするため、情報システムに障害が発生する場合をあらかじめ想定した適切な対策を実施していますか。

(適切な対策には、たとえばシステムの二重化、バックアップと運用記録の取得、障害対応手順の明確化、外部委託先とのサービスレベルの合意などがあります。)

説明

情報セキュリティの重要な要素の一つである可用性に影響を与える事象のうち、影響の度合いが最も大きいのは、情報システム関連機器の障害であると言っても過言ではありません。情報システムに求められる可用性の条件を満たすためには、可用性に関する要求に対応した適切な障害対策機能の情報システムへの組込みが欠かせません。

対策のポイント

1.情報システムの可用性に関する要求は明確で妥当なものか
(可用性とは、情報システムを使う権限のある人がいつでも使えるようにすることをいいます)
2.障害対策の実行に必要なバックアップ情報の取得や、運用記録などの確保を適切に行っているか
3.障害部分の切り離し、縮退運転、情報の回復や情報システムの復旧など、障害発生時に必要となる機能を情報システムに組み込んでおり、それらが適切に機能することを検証しているか
(縮退運転とは、提供する機能やサービスの対象者の絞り込みなどにより、障害時でも、必要最低限のサービスを提供できるようにすることを言います)
4.障害発生時の対応手順や、障害対策処理の実施要領を策定しているか
5.障害対応のスキルに関する教育や訓練を実施しているか
6.情報システムの運用を外部に委託している場合、障害発生時にも所定のサービスレベルが維持されることを、委託先との間で相互に確認しているか
7.システムの各種ログを取得できているか
8.情報セキュリティ事象を適切に評価し、情報セキュリティインシデントとするかを判断しているか

解説

必要となる障害対策の内容は、可用性、すなわち、情報システムを使う権限のある人が、いつでも使えるようにすることに関する要求の程度によって大きく左右されます。そのため、障害対策の検討に当たっては、まず、対象となるシステムの可用性に関する要求を明確化し、その妥当性をチェックしなければなりません。可用性に関する要求として、次の事項を明確にする必要があります。
・最低限運用しなければならない時間帯
・情報システムが停止してから復旧・再開までに許される時間の上限(許容停止時間)

障害対策を検討する上で最も重要な要素には、次のようなものがあります。
・対象となる障害の範囲
・障害発生時における、機能の縮退、バックアップ機への切替え、システムの一時停止などの対応
・システム停止時の情報の回復や情報システムの復旧の手段
・情報システムが停止した場合や、利用が制限された場合における、業務の遂行方法

これらを中心とした障害対策の仕組みがよく検討されていないと、情報システム部門の対応とユーザ部門の対応に齟齬が生じ、全体としての障害対策が効果的に機能しないことがあります。

また、事故への即応処理としてのシステムの切り離し、縮退機能(提供する機能やサービスの対象者の絞り込みなどにより、障害時でも、必要最低限のサービスを提供できるようにする機能)や、情報の回復や情報システムの復旧に必要となる機能は、障害発生時に円滑に機能することが確認されていなければなりません。そのためには、障害対策機能に関するテストの実施や、システム環境の変化に対応するための定期的なチェックが必要となります。

システムに組み込まれた障害対策機能が正常に実行されるためには、バックアップデータや運用の記録などが必要となります。このため、日常のシステム運用の中で、バックアップデータや運用の記録の確保も欠かせません。
また、障害発生時における情報システム部門とユーザ部門の対応は、いずれも日常の運用から見れば大きな例外作業であることから、障害発生時に必要な対応を迅速に行うためには、以下の準備を整えておくことが望まれます。
・障害検知時の報告要領
・障害対策の実施責任者の設置と作業体制の確保
・障害発生時のシステムの切替え手順や、情報の回復から情報システムの復旧に至るまでの処理手順や操作要領
・システム障害発生時における業務実施要領
さらに、両部門の要員が、障害対応作業を適切に実施するためには、関係者への障害対応要領の周知や、必要なスキルに関する教育や訓練などの実施も重要な課題の一つになります。

外部にシステムの運用を委託している場合、障害発生時においても、所定のサービスレベルが保証されるようにしておくことが必要です。そのためには、委託に当たって、許容停止時間などの要求条件、委託先が障害発生時に実施すべき作業や対応などの事項を明確にしておくことが重要です。

なお、障害の検出や原因分析、対処策の検討などに必要なデータとして、様々なログを収集しておくことも必要です。