HOMEソフトウェア高信頼化報告書・出版物・ツール事業成果(報告書等)「情報処理システム高信頼化教訓集(ITサービス編)」2015年度版公開

本文を印刷する

ソフトウェア高信頼化

「情報処理システム高信頼化教訓集(ITサービス編)」2015年度版公開

2017年3月27日更新
2016年3月31日公開
独立行政法人情報処理推進機構
技術本部 ソフトウェア高信頼化センター

概要

 IPA/SECは、ITサービスを担うシステムにおいて類似障害の再発防止や影響範囲縮小を目的に、ソフトウェアに起因する障害関連情報を収集・分析し、対策の整理・体系化を行った上で業界・分野を越えて共有するための取組みを行っています。その取組みの一環で、障害情報から得られた経験やノウハウを「教訓」として普遍化して取りまとめ、「情報処理システム高信頼化教訓集(ITサービス編)」として 2014年5月13日に初版、2015年3月27日には2014年度版を公開しました。
 今回、教訓活用の更なる推進を図るため、本教訓集の内容をより拡充した2015年度版を公開しました。2015年度版では、「システム動作の疑義問合せがあった場合の対応に関する教訓」「運用保守で起きる作業ミスに関する教訓」をはじめとする、様々な事例から得られた教訓を新たに9件追加収録しました。

※2017年3月27日に「情報処理システム高信頼化教訓集(ITサービス編)」2016年度版を公開しました。
※「情報処理システム高信頼化教訓集(組込みシステム編)」2015年度版はこちら

背景

  ITシステムは、今や私たちの生活や社会・経済基盤を支える重要インフラ分野(*1)などのサービスに深く浸透しています。その一方で、社会に大きな影響を与えたシステム障害の発生件数は、2009年から2015年にかけて増加傾向にあり、新聞やテレビなどのメディアでも以下のようなシステム障害に関するニュースを目にする機会が増えています。

  ・○○システムで障害か、終日つながりにくく
    原因は、法律改正直前の駆け込み需要と期末の締め処理とが重なり、想定外の大量入力にシステムの性能が耐えられなかったことである模様。
  ・□□システムで障害、午前中のサービス停止
    原因は、システムの本番装置の故障時に予備装置への自動切替えに失敗したことである模様。

 この背景には、システム障害の原因分析や発生防止対策などの情報が業界内で共有されておらず、類似の障害が繰り返し発生してしまう実状があります。障害が発生しても被害状況等の外から見える情報以外の詳しい情報が公開されず、関係企業のみによって内々に対処されることが多く、一部の大規模障害についてはシステム内部の情報が公開されることがあるものの、その情報が特定の事例に限られた対応策となっている場合が多いため、参考として他社のシステムに活かされにくいことなどが考えられます。

 この問題に対してIPA/SECでは、ITサービスの障害情報の収集・分析と対策の検討を行い、その結果を普遍化した「教訓」として取りまとめ、「情報処理システム高信頼化教訓集(ITサービス編)」として公開しています。

本教訓集の特徴

 本教訓集は以下の観点で取りまとめたもので、幅広い分野において利用できることを目指した内容になっています。

  1. 複数の重要インフラ分野等の有識者・専門家による「重要インフラITサービス高信頼化部会」において多方面から考察を行い、業界横断的に利用可能な要素を抽出。(図1)
  2. 所定の機密保持ルール(教訓集付録A参照)に従って収集した、これまで一般には未公開だった事例や情報も対象に原因や対策について考察。
  3. 有識者・専門家の豊富な経験に基づく知見と、IPA/SEC の10年以上の活動で蓄積されたソフトウェアエンジニアリングに関する検討成果に基づいて取りまとめ、技術領域に加え、ガバナンス/マネジメント領域も対象に教訓を整理。

図1_事例の収集・教訓化の体制と流れ

図1 事例の収集・教訓化の体制と流れ

教訓の例

収集した障害情報を分析し、技術領域、ガバナンス/マネジメント領域の2つの観点から全36件の教訓に分類しました。(表1)

表1 重要インフラ等のシステム障害情報の分析に基づく教訓一覧

※太枠は2015年度追加分

表1重要インフラ等のシステム障害情報の分析に基づく教訓一覧

 教訓集内では、これらの教訓ごとに実際の事例を分析した原因、対策を詳しく記載し、発生しうる障害とその原因を一覧で示すことで、障害と原因の関係性を明確化しています。

 一例として、表1の教訓T21「作業ミスを減らすためには、作業指示者と作業者の連携で漏れのない対策を!」を紹介します。この事例で取り上げる障害は、作業者のシステムへの入力ミスにより、荷物の集荷依頼が誤った集荷先に転送されていたというものです(障害概要を図2に示します)。障害の直接原因は、作業者の些細な誤りでしたが、根本原因は、誤りを見逃しやすい作業環境と、最後の砦となるべき作業指示者の確認不足によるものでした。本事例では、以下の2点を再発防止の対策とすることで、運用保守で起きる作業ミスを減らすための教訓としています。

  • 作業者の観点から、個人、環境、ハードウェア、ソフトウェアの視点で、作業ミスの原因、対策を考える。
  • 作業指示者の観点から、作業指示者は、システムの問題を仕組みや組織として改善することに主眼を置く。

図2 教訓例:T21の障害概要

図2 教訓例:T21の障害概要

効果

 ITシステムの構築・運用やその管理は、社会や技術の進展につれて複雑化・多様化しており、一人や一企業で対応できる範囲には限界があります。そして、その限界は今後ますます顕在化していくものと考えられます。一方、求められる対応は今後一層複雑化・多様化していきます。したがって、システムの構築・運用及びその管理に関わる課題を解決するために、より多くの人々・企業の経験を社会全体で共有・伝承することが求められています。

 本教訓集の内容が、ITサービスの責任者のもとで、システムの構築・運用及びその管理における指針などとして活用されること、また、高信頼なシステムを構築・運用するための基準などに組み込まれることを期待します。

普及・展開

 IPA/SECでは2014年度から、本教訓集の活用に向けた普及展開活動を行うとともに、障害情報の分析に基づく教訓の共有の仕組みを幅広い業界・分野に展開しています。具体的には、業界団体の協力を得ながら、業界ごとなど、より精度の高い形での情報共有の仕組みの構築を目指しています。(図3)
 これにより、障害情報に基づく「教訓」が業界・分野を越えて幅広く共有され、国民生活や社会・経済基盤を支える重要インフラ分野などにおけるシステムの信頼性向上が期待できます。

図3 障害情報に基づく教訓の共有による信頼性向上のしくみ

図3 障害情報に基づく教訓の共有による信頼性向上のしくみ

 また、本教訓集をより有効にご活用いただくために、自社内で発生したシステム障害事例や再発防止策などを自らで「教訓」として作成し、それらを企業間や業界内でも共有・活用可能とするためのガイドブック2編(下記リンク)を公開しています。


「情報処理システム高信頼化教訓作成ガイドブック(ITサービス編)」及び 「情報処理システム高信頼化教訓活用ガイドブック(ITサービス編)」を公開

脚注

(*1)内閣サイバーセキュリティセンターでは「情報通信、金融、航空、鉄道、電力、ガス、政府・行政サービス、医療、水道、物流、化学、クレジット、石油」の13分野を重要インフラに定義している。(平成26年5月19日「重要インフラの情報セキュリティ対策に係る第3次行動計画」(平成27年5月25日改訂))

ダウンロード

教訓のリンク集(ITサービス編)

 情報システム高信頼化教訓集(ITサービス編)に収録されている教訓一覧から個々の教訓を照会できるようになりました。
 「情報処理システム高信頼化教訓集(ITサービス編)」各教訓のリンク集
 このリンク集には報告書に記載された教訓に加えて、最近作成された教訓も随時登録していきます。

更新履歴

2016年5月11日 「サービスやシステムの信頼性を高めるための教訓集 ダイジェスト(2015年度版)」PDF版の追加、及び 「情報処理システム高信頼化教訓集(ITサービス編)」2015年度版を更新しました。
2016年6月7日 「ダウンロード時のアンケート実施のお知らせ」を掲載しました。
2017年3月27日 ・「情報処理システム高信頼化教訓集(ITサービス編)」2016年度版へのリンクを追加しました。
・表1を修正しました。
教訓T8:
【修正前】性能監視は運用要件の要である【修正後】性能監視は運用の要である
教訓T13:
【修正前】業務シナリオに則した【修正後】業務シナリオに即した