RAID 5は、ディスクのストライピングとパリティの両方を使用するハードディスクドライブのデータバックアップ技術です。RAIDのレベルの1つ: RAIDとは、Redundant Array of Independent Disksの略で、元々はInexpensive Disksの略です。RAIDは1980年代に開発され、複数のバージョンがありますが、RAID 5はその一つに過ぎませ。IBMは1980年代からRAID 5の特許を持っています。
RAID 5テクノロジー
ディスクのストライピング
ディスクのストライピングは、RAIDの初期バージョンであるRAID 0で初めて導入されました。これはアレイ内の全データを複数のディスクに分散します。しかし、ディスクのストライピングは、1つのディスクが故障するとそのディスク上のデータが失われ、失われたファイルを回復する方法がないため、信頼性の低いバックアップ技術であることがすぐに判明しました。
ディスク・ミラーリングは、技術の専門家ならRAIDを連想するでしょうが、ディスクの冗長性を作り出す一般的な技術です。データは1つのディスクから、それをミラーリングするもう1つのディスクに完全にコピーされます。しかし、RAID 5はディスク・ミラーリングを使用せず、ディスク・ストライピングとパリティと呼ばれるデータ・チェック技術を組み合わせています。
パリティ
エラーによってファイルのビットが失われる可能性があるため、パリティはデータが正しく転送されることを保証します。パリティは、チェックサムを通じてビットチェックを行い、データの安全性を管理します。ディスクのストライピングは信頼性の高いバックアップ・システムを提供しませんが、パリティはデータが失われたときにそれを判断するように設計されています。
パリティを使用するディスク・ドライブは、他のドライブからのすべての情報に基づいて、失われたデータを再構築することができます。パリティは、失われたデータを再構築するために、他のディスクに残っている情報と自分の持っている情報を使って、XOR演算によって数学的に行います。
パリティを使用するアレイには、通常、パリティデータ専用のドライブ容量が必要です。しかし、RAID 5のパリティは、1つのディスクにすべて保存するRAID 4とは異なり、各ドライブに分散されます。これにより、セキュリティが強化されます(ドライブが故障しても、すべてのパリティデータが失われるわけではありません)。また、ディスクドライブに関する一般的な注意点として、RAID構成をフォーマットするとそのスペースの一部が使用されるため、ディスクで使用可能な正確な容量が広告に記載されている容量と異なる場合があります。
RAID 5の利点とは?
RAID 5は、RAIDの最も一般的な構成の1つです。2つのディスク技術を組み合わせることで、データ損失を最小限に抑え、読み取りパフォーマンスを向上させます。RAID 5はディスクのストライピングを使用するため、他のRAIDよりも高速な読み取り速度を実現します。データはドライブに分散されるため、ドライブは同時に読み取ることができます。ディスクのストライピングはそれだけでは信頼できるバックアップ技術ではありませんが、RAID 5はパリティも使用してデータの正確性をチェックし、必要に応じてデータを置き換えます。
RAID 5は3台のディスクドライブしか必要としないため、小規模なディスクアレイの冗長ソリューションとして適しています。また、より安価な冗長バックアップソリューションの一つでもあります。
RAID 5のデメリットは?
RAID 5は小規模なアレイには適していますが、大容量ディスクやサーバには適していません。特に大容量ディスクは書き込みに時間がかかります。あるディスクに障害が発生し、アレイがRAIDを使用してデータを再構築する場合、書き換えプロセスが終了する前に別の問題が発生する可能性があります。RAID 5は複数のディスク障害に耐えられるようには設計されていないため、2つの障害でアレイ全体がダウンする可能性があります。
ディスクの故障はHDDに起こりうることであり、RAID 5は合計1つのディスク故障しか許容しないため、大規模なアレイに適したソリューションではないし、ディスクに保存されたファイルの唯一のバックアップソリューションであるべきでもありません。多くのデータストレージの専門家は、ハードドライブはディスク故障の影響を受けやすく、複数のディスク故障がデータ損失の原因となるため、RAID 5はもはやハードドライブのバックアップソリューションとしては適していないと考える人もいます。
SSD向けRAID 5
RAID 5はソリッドステートドライブ(SSD)にも使用できます。ソリッドステートドライブは不揮発性メモリ記憶装置で、ハードドライブよりもはるかに高速です。SSDはHDDよりも故障しにくく、読み込み速度も速いので、リビルド処理も速くなります。
データの再構築にパリティを使用する場合、SSDは2回目の故障の影響を受けやすいです。一度に複数の回復不能な読み取りエラー(URE)が発生する可能性は低いが、HDDはリビルド中に複数のUREが発生する可能性が高いです。
唯一の潜在的な問題は、SSDが最終的に故障した場合、同じ寿命であれば、アレイ内の他のSSDも同じ時期に故障する可能性が高いということです。そのため、SSDにRAID 5を採用する場合は、まったく同じ年式ではないドライブを使用することを検討したほうがよいでしょう。異なるドライブを使用すると、互換性の問題など他の問題が発生する可能性がありますが、ドライブが同時に故障すると、データ全体が失われる可能性があります。
編集後記:RAID 6
RAID 6はRAID 5 とほぼ同じ構成で、各ディスクに複数のパリティブロックを使用するデュアル分散パリティのブロックレベルストライピングを使用します。
関連トピックス:
- RAID5やRAID6はストレージのパフォーマンスと容量にどのような影響を与えるか
- ディスク・レイテンシーとRAIDグループがどのようにVMパフォーマンスに影響するか?[ストレージ・コンフィグレーション:1/5]
- VMパフォーナンスを促進するLUNコンフィグレーションのベスト・プラクティス[ストレージ・コンフィグレーション:5/5]
- Windowsストレージ・スペース(Storage Spaces):Windows Server用シンプロビジョニング
- 仮想マシンのためのストレージLUNを構成するための最良の方法は?
- LUNでどの位のVMを保持できるか?[ストレージ・コンフィグレーション:4/5]
- AWS EC2のディスクアレイ(LVMやダイナミックディスク)をバックアップ パート2:一貫性問題
- VMware vCenter Server 5.0でデータベースを共有ためのガイドライン