重要インフラ障害情報の分析に基づく「情報処理システム高信頼化教訓集(ITサービス編)」 ~障害の再発防止のため、業界を越えて幅広く障害情報と対策を共有する仕組みの構築に向けて~
2016年3月31日更新
2014年5月13日公開
独立行政法人情報処理推進機構
技術本部 ソフトウェア高信頼化センター
概要
ITサービスを担うシステムの主としてソフトウェアに起因する障害関連情報を収集し、それらの分析や対策の整理・体系化を行い「教訓」として普遍化し、類似障害の再発防止や影響範囲縮小のために業界・分野を越えて活用可能な「情報処理システム高信頼化教訓集(ITサービス編)」として取りまとめました。
※2016年3月31日に「情報処理システム高信頼化教訓集(ITサービス編)」2015年度版を公開しました。
※2015年3月27日に「情報処理システム高信頼化教訓集(ITサービス編)」2014年度版を公開しました。
背景
ITシステムは、今や私たちの生活や社会・経済基盤を支える重要インフラ分野(*1)などのサービスに深く浸透しています。その一方で、社会に大きな影響を与えたシステム障害の発生件数は、2009年から2012年にかけて増加傾向にあり、新聞やテレビなどのメディアでも以下のようなシステム障害に関するニュースを目にする機会も増えてきています。
|
・○○システムで障害か、終日つながりにくく |
|
|
… |
原因は、法律改正直前の駆け込み需要と期末の締め処理とが重なり、想定外の大量入力にシステムの性能が耐えられなかった模様。 |
|
・□□システムで障害、午前中のサービス停止 |
|
|
… |
原因は、システムは本番装置の故障により予備装置に自動的に切り替わるようになっていたが、その切替えが失敗したためという。 |
この背景には、システム障害の原因分析や発生防止対策などの情報が業界内で共有されておらず、類似の障害が繰り返し発生してしまう実状があります。障害が発生してもその詳しい情報が公開されずに当事者のみで対処されることが多く、また一部の大規模障害は、情報が公開されることがあるものの、その情報が特定の事例への対応策となっている場合が多いため、障害に対する情報が他者への参考として活かされにくいことなどが考えられます。
そこでIPA/SECでは、ITサービスの障害情報の収集・分析と対策の検討を行い、その結果を普遍化した「教訓」として取りまとめ、「情報処理システム高信頼化教訓集(ITサービス編)」として公開しました。
本教訓集の特徴
本教訓集は従来の事例集と異なり、以下の観点で取りまとめたもので、幅広い分野において利用できることを目指した内容になっています。
- 複数の重要インフラ分野等の有識者・専門家による「重要インフラITサービス高信頼化部会」において多方面から考察を行い、業界横断的に利用可能な要素を抽出。(図1)
- 所定の機密保持ルール(今回同時公開)により収集した、これまで一般には未公開の事例や情報も対象に原因や対策について考察。
- 有識者・専門家の豊富な経験に基づく知見と、IPA/SEC の10年間の活動で蓄積されたソフトウェアエンジニアリングに関する検討成果に基づいて取りまとめ、技術領域に加え、ガバナンス/マネジメント領域も対象に教訓を整理。

図1 事例の収集・教訓化の体制と流れ
教訓の例
収集した障害情報を分析し、技術領域、ガバナンス/マネジメント領域の2つの観点から全9件の教訓に分類しました。(表1)
表1 重要インフラ等のシステム障害情報の分析に基づく教訓一覧

教訓集内では、これらの教訓ごとに実際の事例を分析した原因、対策を詳しく記載し、発生しうる障害とその原因を一覧で示すことで、障害と原因の関係性を明確化しています。
一例として、表1の教訓「バックアップ切替えが失敗する場合を考慮すべし」に含まれる失敗原因の一覧を図2に示します。同図に示されるさまざまな失敗原因にあらかじめ配慮してシステムの開発・運用を行うことにより、過去に発生した障害と類似の障害の発生を防ぐことができます。

図2 教訓例:待機系システムへの切替えが失敗する原因一覧
効果
ITシステムの構築・運用やその管理は、社会や技術の進展につれて複雑化・多様化しており、一人や一企業で対応できる範囲には限界があります。そして、その限界は今後ますます狭くなっていくものと考えられます。一方、求められる対応は今後一層複雑化・多様化していきます。したがって、システムの構築・運用およびその管理に関わる課題を解決するために、より多くの人たち・企業の経験を社会全体で共有・伝承することが求められています。
本教訓集の内容が、ITサービスの責任者のもとで、システムの構築・運用およびその管理における指針などとして活用されること、また、高信頼なシステムを構築・運用するための基準などに組み込まれることを期待します。
展開
今後は、本教訓集の活用に向けた普及展開活動を行うとともに、障害情報の分析に基づく教訓の共有の仕組みを幅広い業界・分野に展開していく予定です。具体的には、業界団体の協力を得ながら、業界ごとなど、より精度の高い形での情報共有の仕組みの構築を目指していきます。(図3)
これにより、障害情報に基づく「教訓」が業界・分野を越えて幅広く共有され、国民生活や社会・経済基盤を支える重要インフラ分野などにおけるシステムの信頼性向上が期待できます。

図3 障害情報に基づく教訓の共有による信頼性向上のしくみ
脚注
(*1) | 内閣官房情報セキュリティセンターでは「情報通信、金融、航空、鉄道、電力、ガス、政府・行政サービス、医療、水道、物流」の10分野を重要インフラに定義している。(平成24年4月26日「重要インフラの情報セキュリティ対策に係る第2次行動計画」) |
ダウンロード
※「情報処理システム高信頼化教訓集(製品・制御システム編)」は
こちら
IPA/SECでは、「情報処理システム高信頼化教訓集(ITサービス編)」について、障害情報の取扱いルールを含め、皆様からのご意見、ご要望などをいただき、記載内容の充実を図りたいと考えております。皆様からの率直なコメントを頂ければ幸いです。
ご意見などの送付先:
更新履歴
2014年6月3日 |
PartⅡ 障害対策手法・事例集
・Ⅱ-2:表1-1中の誤記を修正しました。
【修正前】⑧非機能要求グレード
【修正後】⑨非機能要求グレード
・Ⅱ-9, 16:JIS番号の誤記を修正しました。
【修正前】JIS Q 2000
【修正後】JIS Q 20000-1
・Ⅱ-16:参考文献5を修正しました。
【修正前】IPA/SEC『要求工学知識体系(REBOK)概説』2007年 http://www.ipa.go.jp/files/000005375.pdf
【修正後】一般社団法人情報サービス産業協会REBOK企画WG
『要求工学知識体系 第1版』2011年PartⅢ 障害分析手法・事例集
・Ⅲ-2:本文との整合を取るため、表2-1を差し替えました。
【修正内容】番号11の行を削除
|
2015年3月27日 |
2014年度版へのリンクを追加しました。
|
2016年3月31日 |
2015年度版へのリンクを追加しました。
|