ITリカバリの基礎と実務ガイド:RTO/RPOを軸にしたバックアップと災害復旧戦略
リカバリとは何か — ITにおける基本概念
リカバリ(recovery)とは、ITシステムやデータが障害・消失・破損・誤操作・災害などにより正常な状態を失った際に、業務継続や利用者サービスの復旧を目的としてシステムやデータを元の、あるいは許容可能な状態へ戻す一連のプロセスを指します。単にファイルを復元する「データ復旧」から、企業全体のシステムを復旧する「災害復旧(Disaster Recovery: DR)」まで、範囲と手法は多岐にわたります。
リカバリの種類
- データ復旧(Data Recovery):削除、フォーマット、物理故障などで失われたデータを復元する技術とサービス。
- システムリカバリ:OSやアプリケーションを含むシステムイメージの復元、リカバリパーティションやインストールメディアを用いる作業。
- ファクトリーリセット:端末を出荷時状態に戻す手法。個人機器でよく使われるが、データ消失を伴うため注意が必要。
- 災害復旧(DR):自然災害や大規模障害発生後にデータセンターやクラウド環境等を切り替え、業務を最小限の停止で再開するための戦略と実行。
- 事業継続計画(BCP)関連のリカバリ:業務プロセス全体を守る観点から設定された復旧優先順位や手順。
主要概念:RTO と RPO
リカバリ設計で不可欠な指標が、RTO(Recovery Time Objective)とRPO(Recovery Point Objective)です。
- RTO:サービス停止から復旧完了まで許容できる時間(時間目標)。
- RPO:データ損失の許容範囲を時間で表したもの。最後の正常バックアップから許容できる遡り時間。
この2つを基に、どのバックアップ方式・レプリケーション・フェールオーバー戦略を採用するかが決まります。
リカバリのための主要技術と手法
- フルバックアップ/増分/差分バックアップ:保存期間とリストア時間のトレードオフを考慮。
- スナップショット:一定時点の高速イメージ取得。仮想環境やストレージで一般的。
- レプリケーション(同期/非同期):別拠点へデータを書き写しておくことで、障害時の切替を容易にする。
- イメージバックアップ/ブート可能メディア:システム全体を丸ごと復元できるため、OSクラッシュ時の復旧がスムーズ。
- クラウドベースのバックアップとDR:スケーラブルで地理的冗長性を提供。IaaS上のスナップショットやマネージドバックアップサービスが利用される。
- RAID 等の冗長化:ストレージ障害に対する耐性向上。ただしバックアップの代替にはならない(論理的ミスやウイルスは防げない)。
リカバリ設計の実務ポイント
- 重要データの分類と優先度付け:何を最優先で戻すか(業務に与える影響を基準に)を明確化。
- バックアップポリシーの策定:頻度、保持期間、保存場所、暗号化、アクセス制御を規定する。
- テスト計画:リカバリ手順は定期的に実行テスト(リストアテスト)して有効性を検証する。
- 自動化とドキュメント化:手順の自動化は人的ミス低減に有効。手順書は最新状態に保つ。
- セキュリティ考慮:バックアップデータの暗号化、アクセス権管理、ログ監査を行う。ランサムウェア対策としてオフラインや不変ストレージを検討。
運用での注意点と落とし穴
多くの企業が犯すミスとして、バックアップはあるが「復元テストをしていない」、暗号化でバックアップメディアの鍵を失い復元不可になる、またはストレージ冗長化をバックアップの代替と誤認することがあります。さらに、法規制やコンプライアンス(ログ保持期間、個人情報保護)に基づく保存要件を満たしているかも確認が必要です。
リカバリの実行手順(一般的な流れ)
- 障害の検知と影響範囲の特定(何がどの程度ダウンしているか)。
- 優先順位に基づくリカバリ対象の決定(重要度に応じて段階復旧)。
- 適切なバックアップやイメージからのリストア実行。
- 整合性チェック(データ整合性やアプリケーション動作確認)。
- 正常稼働へ切り戻し・切替(必要に応じてDNS、ロードバランサー、フェールオーバー設定を変更)。
- 事後分析と対策(根本原因の特定、再発防止策、手順改訂)。
クラウド時代のリカバリ:留意点
クラウドではDRやバックアップの選択肢が増えますが、「クラウド = 安全」ではありません。クラウドプロバイダに依存する設計(ベンダーロックイン)やデータ排他性、領域やリージョン選択による法令対応、料金体系(データ取り出し・保管コスト)などを考慮する必要があります。マルチリージョン・マルチクラウド戦略や、インフラ自動化(IaC)を用いた迅速なリプロビジョニングが有効です。
テストと訓練の重要性
リカバリ計画は「作って終わり」ではありません。定期的な復旧訓練、想定外シナリオ(ランサムウェア、同時多障害、ネットワーク分断)に対するテスト、関係者のロールプレイが重要です。訓練を通じて手順書の齟齬やツールの問題点が明らかになり、実運用での復旧成功率が高まります。
まとめ
リカバリは単なる技術的作業ではなく、業務継続を支える戦略的プロセスです。RTO/RPOの明確化、適切なバックアップ・レプリケーション技術の選定、定期的なテストとセキュリティ対策、そして運用ルールとドキュメントの整備が不可欠です。これらを組織的に運用することで、障害発生時の被害を最小化し、素早い復旧を実現できます。
参考文献
- NIST Special Publication 800-34 Rev.1 — Contingency Planning Guide for Federal Information Systems (PDF)
- Microsoft Learn — 災害復旧 (Disaster recovery) の定義と考え方
- AWS ホワイトペーパー — Disaster Recovery
- Wikipedia — データ復旧(日本語版)
- JPCERT/CC — バックアップの基本と注意点
- ISO 22301 — Business continuity management systems


