RAIDの初期化プロセスを知っていますか?
Mar 10, 2023RAID システムは、保存されたデータを保護する有効な手段です。 RAID の作成中、システムの初期化に時間がかかります。 RAID の初期化中にこのような操作が存在するのはなぜですか? これは SSDS にどのような影響を与えますか?
RAID グループに追加されたすべてのディスクは、LBA アドレスに基づいて一連のスライスに分割されます。これらのスライスは、ストライプ ユニットと呼ばれます。異なるディスク上の同じ LBA アドレスに対応するストライプ ユニットは、ストライプに編成されます。 2 つのエンコードされたデータ ブロック P と Q を生成する RAID6 のように、すべてのデータを 1 つのストリップにエンコードすると、両方のデータ ディスクが同時に破損する可能性があります。
したがって、RAID システムでは、ストリップ内のすべてのデータがコーデック アルゴリズムのルールを満たしている必要があります。つまり、ストリップ内のすべてのデータは、特定の規則に従ってエンコードされたデータを生成でき、エンコードされたデータはストリップに格納されているものと同じです。 これは、ストリップ内のデータが一貫している場合と言われています。 ディスクに障害が発生した場合、失われたデータ ブロックは、ストリップに格納されているエンコードされたデータを使用して復元できます。
ストリップ内のデータが矛盾している場合、つまり、ストリップ内のエンコードされたデータは、ストリップに格納されているエンコードされたデータとは異なります。ディスクに障害が発生した場合、ストリップに格納されているエンコードされたデータを使用して、失われたデータ ブロックを回復することはできません。 したがって、不整合なデータを含むストライプは、障害が発生したときにデータの正確性の問題を引き起こします。
RAID システムを作成する場合、RAID グループ内のディスクは、新しいディスクまたは使用済みのデータ ディスクである可能性があります。これらのディスクのデータには、すべてゼロを含めることはできません。 この場合、これらのディスクによって構成されるデータ ストリップは、データの整合性の要件を満たすことができません。 すなわち、各ストリップ内のある規則に従って計算された符号化データは、ストリップ内の符号化データと一致しない。一貫性のないデータ ストライピングは、RAID データの正確性に大きなリスクをもたらします。
このため、RAID アレイを作成するときは、システム内のすべてのストライプを初期化して、データの一貫性を確保してください。 通常、ストリップの初期化は次の 2 つの方法で行うことができます。
1. すべてゼロを書き込むことにより、RAID システム内のすべてのストリップを初期化します。 データがすべてゼロのストリップのパリティ データもゼロです。 したがって、すべてゼロのデータは、ストリップの一貫性を確保できます。
2. すべてのストライプに対してパリティ計算を実行し、ストライプ内のパリティ データを更新して、データの一貫性を確保します。
RAID システムの初期化は非常に長いプロセスです。主な理由は、システム内のすべてのストリップを初期化する必要があるためです。 また、フロントエンド ユーザー IO とのパフォーマンス バランスも考慮する必要があります。そのため、通常、RAID システムの初期化はバックグラウンド プロセスであり、これは長時間続き、フロントエンド アプリケーションのパフォーマンスに影響を与えます。
SSDS の場合、RAID システムの初期化プロセスは他の問題も引き起こします。 システムの初期化中に、ゼロ書き込みまたはパリティ データ更新モードに関係なく、データを SSDS に書き込む必要があります。このプロセスにより、不要なデータ書き込みの拡大が発生します。 ユーザー データが書き込まれる前に、初期化によって SSD 内にデータ マッピング テーブルが確立されます。 SSDS の耐用年数とパフォーマンスが低下します。 したがって、SSDS 用の RAID システムは、システムの初期化プロセス用に最適化する必要があります。これは、従来の RAID では考慮されていない特殊な機能です。 そのため、従来の RAID アレイを SSDS に直接展開することはできず、SSD の寿命とパフォーマンスに影響します。
RAID システムはストライピングを使用してデータを保護しますが、データ保護をストライピングする過程で一連の問題も発生します。システムの初期化は、ストリップの一貫性に関する典型的な問題です。 優れた RAID データ保護システムは、設計プロセス中にこの問題を解決します。たとえば、EMC Data Domain RAID にはシステムの初期化プロセスがありません。もちろん、ファイル システムと連携する必要があり、RAID ストリップ データ分散で多くの最適化が行われています。