3カ月で改善!システム障害対応 実践ガイド インシデントの洗い出しから障害訓練まで、開発チームとユーザー企業の「協同」で現場を変える
書籍情報
発売日 : 2023年09月19日
著者/編集 : 野村 浩司/松浦 修治
出版社 : 翔泳社
発行形態 : 単行本
ページ数 : 224p
書籍説明
内容紹介
1000件以上の事例を7年分析して見つけたメソッド本書は、システム障害対応の大事なところを押さえて、最短で改善する方法を解説しています。属人化・人的ミスを回避し、障害対応の改善効果をすぐに実感できるメソッドです。障害対応を改善しようと思っても、”結局何も変わらない”という状態から脱却へ!インシデント分析やアクション決定、障害訓練まで、各プロセスに役立つ便利な雛形のダウンロード特典も。〈著者紹介〉野村浩司:株式会社NTTデータで、金融システムの開発保守運用と改善を12年担当。松浦修治:株式会社リクルートで、人材事業のプロジェクトマネジメント、ITサービスマネジメントを14年担当。〈目次〉・PART 1 システム障害対応の目的と改善効果CHAPTER 1 システム障害対応の意義CHAPTER 2 システム障害対応改善の始め方CHAPTER 3 なぜシステム障害対応を改善するのか?・PART 2 システム障害対応改善の阻害要因と成功要因CHAPTER 4 システム障害対応 改善の難所CHAPTER 5 改善の肝となるサービス視点での運用設計・PART 3 実践!システム障害対応の改善ステップCHAPTER 6 システム障害対応の課題特定CHAPTER 7 アラート・問い合わせの分類と処置で短期効果を目指す第1週 アラート・問い合わせの洗い出し第2週 アラート・問い合わせの分類第3週 「対処不要」なアラート・問い合わせの特定と処置第4週 「定型」的なアラート・問い合わせの特定と処置CHAPTER 8 障害検知後の判断とアクション実行を効率化する第5週 システム障害発生時のアクション定義第6週 アクション決定への判断情報と基準の定義第7週 アクション実行の役割と権限の定義第8週 頻出アクション・判断情報と基準の効率化CHAPTER 9 大規模障害に備えて体制を構築する第9週 大規模障害の定義とエスカレーション第10週 大規模障害時の体制構築第11週 コミュニケーションルールの制定第12週 システム障害対応訓練と振り返りCHAPTER 10 継続改善のための役割最適化・付録1 システム障害対応改善の実践事例・付録2 システム障害対応改善に役立つ便利な雛形・付録3 タスク&チェックポイント
目次
PART 1 システム障害対応の目的と改善効果
CHAPTER 1 システム障害対応の意義
CHAPTER 2 システム障害対応改善の始め方
CHAPTER 3 なぜシステム障害対応を改善するのか?PART 2 システム障害対応改善の阻害要因と成功要因
CHAPTER 4 システム障害対応改善の難所
CHAPTER 5 改善の肝となるサービス視点での運用設計PART 3 実践!システム障害対応の改善ステップ
CHAPTER 6 システム障害対応の課題特定
CHAPTER 7 アラート・問い合わせの分類と処置で短期効果を目指す
第1週 アラート・問い合わせの洗い出し
第2週 アラート・問い合わせの分類
第3週 「対処不要」なアラート・問い合わせの特定と処置
第4週 「定型」的なアラート・問い合わせの特定と処置
CHAPTER 8 障害検知後の判断とアクション実行を効率化する
第5週 システム障害発生時のアクション定義
第6週 アクション決定への判断情報と基準の定義
第7週 アクション実行の役割と権限の定義
第8週 頻出アクション・判断情報と基準の効率化
CHAPTER 9 大規模障害に備えて体制を構築する
第9週 大規模障害の定義とエスカレーション
第10週 大規模障害時の体制構築
第11週 コミュニケーションルールの制定
第12週 システム障害対応訓練と振り返り
CHAPTER 10 継続改善のための役割最適化付録1 システム障害対応改善の実践事例
付録2 システム障害対応改善に役立つ便利な雛形
付録3 タスク&チェックポイント
CHAPTER 1 システム障害対応の意義
CHAPTER 2 システム障害対応改善の始め方
CHAPTER 3 なぜシステム障害対応を改善するのか?PART 2 システム障害対応改善の阻害要因と成功要因
CHAPTER 4 システム障害対応改善の難所
CHAPTER 5 改善の肝となるサービス視点での運用設計PART 3 実践!システム障害対応の改善ステップ
CHAPTER 6 システム障害対応の課題特定
CHAPTER 7 アラート・問い合わせの分類と処置で短期効果を目指す
第1週 アラート・問い合わせの洗い出し
第2週 アラート・問い合わせの分類
第3週 「対処不要」なアラート・問い合わせの特定と処置
第4週 「定型」的なアラート・問い合わせの特定と処置
CHAPTER 8 障害検知後の判断とアクション実行を効率化する
第5週 システム障害発生時のアクション定義
第6週 アクション決定への判断情報と基準の定義
第7週 アクション実行の役割と権限の定義
第8週 頻出アクション・判断情報と基準の効率化
CHAPTER 9 大規模障害に備えて体制を構築する
第9週 大規模障害の定義とエスカレーション
第10週 大規模障害時の体制構築
第11週 コミュニケーションルールの制定
第12週 システム障害対応訓練と振り返り
CHAPTER 10 継続改善のための役割最適化付録1 システム障害対応改善の実践事例
付録2 システム障害対応改善に役立つ便利な雛形
付録3 タスク&チェックポイント
著者情報
野村 浩司
松浦 修治