バックアップについて調べてみた件

バックアップ (英: backup) とはコンピュータシステムで主にデータやシステムの状態を複製し問題発生時の復旧(リストア)に備えるという意味がある。

データバックアップ

全てのデータは損失の危険を常にはらんでいる。特に企業にとって重要データのバックアップは事業継続計画に密接な関係があり、適切なバックアップ・リストア計画と運用が重要となっている。特に念頭に入れるべき事を以下に述べる。

リスク分類

両リスクに備える必要がある。

  • 論理破壊 – ヒューマンエラー、データソース自体の誤り、ソフトウェア/ファームウェアバグ、悪意ある改ざん(コンピュータウイルスやクラッキング)
  • 物理的破壊や紛失 – ハードウェア故障、自然災害、盗難
  • バックアップ単位

    ファイルバックアップ

    ファイルシステムを経由してバックアップする。すなわちバックアップ対象はファイルやフォルダである。ファイルシステムが持つタイムスタンプを利用できるため、増分バックアップや差分バックアップを実現しやすい。復旧時には復元先のファイルシステムが予め構築されている必要があり、復旧までに手順を要することがある。

    イメージバックアップ

    ハードディスクのパーティション単位でファイルシステムを用いずにバックアップする。一般にnullデータを読み飛ばすことは出来ず全域をバックアップする。過去のバックアップデータ全量が比較対象となるため増分・差分バックアップを実現しにくい。復旧時にはパーティション全体をリストアするので、ファイルバックアップと比較して復旧手順が少ない。

    レベル

  • 必要なデータ全てを複製する。
  • 毎回すべてのデータを複製しなければならないため時間がかかる。
  • すべてのデータが一ケ所にまとまっているので、復旧時にデータを探し回る必要がない。
  • バックアップ先に充分な空きが必要。
  • 前回のフルバックアップからの変更/追加されたデータのみを複製。
  • 一回はフルバックアップを行う事が必要。
  • 最後のフルバックアップとの差分を複製するだけなので時間は短い。
  • バックアップツールを使わない場合は自分で変更/追加したデータを把握しなければならない。
  • 復旧は最後のフルバックアップデータと最後の差分バックアップデータが必要になる。
  • 前回のフルバックアップ、差分バックアップ、もしくは増分バックアップ時からの変更/追加されたデータのみを複製。
  • 一回はフルバックアップを行う事が必要。
  • 最後のバックアップ以降に変更/追加されたデータを複製するだけなので時間は極めて短い。
  • バックアップツールを使わない場合は自分で変更/追加したデータを把握しなければならない。
  • 復旧は最後のフルバックアップデータと(もしあれば)最後の差分データと、それ以降のすべての増分データが必要。
  • その他考慮すべき項目

    範囲

    どのデータをバックアップするか。データベースをバックアップする、各ユーザのホーム・ディレクトリをバックアップする等。

    頻度 (目標復旧地点)

    毎日、毎週、月次、年次等。頻度が低いほど潜在的に失われる量も大きくなる。目標復旧地点(RPO: Recovery Point Objective)に関係する。

    保存期間

    バックアップをどのくらいの期間保持するか。データや業種によっては、法律により定められている場合がある。

    保管場所

    サイト全体の障害(自然災害など)を考慮しデータを遠隔地に保管することが望ましい。例えばリムーバブルメディア、主に磁気テープにバックアップし遠隔地に保管する。または、ネットワークを経由してオンラインストレージや遠隔のデータセンターなどにバックアップする方法がある。媒体の紛失や情報漏洩を防ぐために所定の場所に保管・管理することが通常である。保管場所には機密性に応じて施錠や認証などのセキュリティを施し、管理者を限定するなどの対策が重要になる。信頼できる外部の業者に委託する事もある。これら方針はバックアップだけでなく、セキュリティ方針にも関係する。

    復旧時間

    データが消失した際にいつまでにデータ復旧すべきか。目標復旧時間(RTO: Recovery Time Objective)と呼ばれる。

    メディアの種類

    複数のメディアにバックアップすることが推奨される。例として1次バックアップにはHDD等の高速メディアを使い、2次にはDVDや磁気テープなどの低速メディアを使う。多様な媒体にバックアップする事で、それぞれの特徴を生かしつつファームウェアのバグ等によるデータ消失も回避出来る。

  • フロッピーディスク
  • 大容量磁気ディスク
  • 磁気テープ(コンピュータ用)
  • カセットテープ
  • 光ディスク
  • フラッシュメモリ
  • 光磁気ディスク
  • ハードディスクドライブ
  • 特徴的な技術

    データ量の削減とセキュリティーの向上のためデータ圧縮、暗号化及び重複排除等の技術が併用されることが多く、バックアップソフトウエア・ハードウエアはこれら機能を実装していることも多い。仮想化技術、例えばテープライブラリをHDDで置き換える仮想テープライブラリという技術もある。なお、RAIDはアレー内のディスクの物理破壊にしか対応できず、論理破壊や自然災害の対策にはならない事に留意する。寧ろこれはバックアップではなく可用性を高める技術であると理解する必要がある。

    データ復旧

    実際の運用ではバックアップに比較して復旧の頻度は相当に低くテストが疎かになりがちである。いざという時に復旧出来ないのであれば高価なバックアップ装置はただの無駄であり、計画的な復旧テストを実施する事はバックアップ計画以上に重要である。

    データのベリファイ

    意図したバックアップ計画通りに運用出来ているかを確認するのみならず、データが正しく読み出せる事を定期的にチェック必要がある。チェックサムでデータの一貫性をチェックする事が一般的な方法である。チェックサムでのエラーが発生した場合、直ちにメディアの交換とデータの再記録を検討する必要がある。必要であれば遠隔地保管しているメディアも呼び戻してベリファイする。

    機器のヘルスチェック

    稼働時間、書き込み容量及び平均故障間隔等を基準に定期的に機器のヘルスチェックとメンテナンスを行う事が必要がある。急な故障が発生しても復旧できるように普段から故障率をモニターして過不足ない機器交換計画の立案と予備品を調達しておく事も重要である。なお磁気テープでは凡そのヘルスチェックが可能な機能がある。

    復旧手順書の確認

    復旧手順書が存在しない場合、管理者の異動や退職に伴い復旧できなくなる可能性がある。手順書を常に最新の状態に保ち災害発生時でも簡単に取り出せる場所に保管しておく必要がある。

    復旧訓練

    機器故障や或いはサイトの火災・停電などを模擬して実際の復旧訓練を行う事も重要である。思わぬ因子で復旧できなくなる可能性、例えば消火ガス噴射の衝撃音が大量のハードディスクとサーバを破壊したという例もあり、想定外の因子に備えるためにも訓練が必要である。

    システムのバックアップ

    リスクマネジメントでシステム停止の可能性と損害を洗い出し、かけられるコストを勘案して運用される。

    リスク分類と対処法

  • 装置故障 – 部品劣化、電源障害(瞬停など)、作業ミス
  • 対処法: フェイルオーバークラスタ、冗長化、ホット/コールドスタンバイ
  • 電源供給不足 – 停電
  • 対処法: 自家発電装置や無停電電源装置
  • サイトの機能不全 – 大規模災害、パンデミック、紛争、DoS攻撃
  • 複数サイトにシステムを分散
  • 参考文献

    関連項目

  • 冗長化
  • アーカイブ (コンピュータ)
  • ディザスタリカバリ
  • 可用性
  • スナップショット
  • レプリケーション
  • ミラーリング、ファイル同期
  • rsync
  • セーブ (コンピュータ)
  • カテゴリ:

    • 記憶装置
    • データベース
    • コンピュータのデータ
    • 信頼性工学

    隠しカテゴリ:

    • 出典を必要とする記事/2013年3月

    ※ 参照元:https://ja.wikipedia.org