RAIDがFailedやDegradedになった時の対処法

2016/7/29更新

RAID1を構築しているのですが、DegradedとかFailedになってパニックになった時の話です。

まず初めに落ち着いて下さい。(^^;;;

このページに来るということは、きっとRAIDに問題があって大変な目に遭っていることと思います。私もこれまで何度も大変な目に遭いました。でも、この投稿を落ち着いて読めばきっと大丈夫です。

私はRAID1(ミラーリング)を構築しています。ある日Windowsが止まってしました。[Ctrl]+[Alt]+[Del]も受け付けない状態です。やむを得ず電源を停止させたのですが、起動するとこんな画面になりました。

RAID Degraded

RAID Degraded

Degradedとは

Degradedの意味は、RAID1を構成するハードディスク2台の内容が異なっているという事です。私の経験では、Windowsがブルーバックしたりフリーズしたりした後、やむを得ずリセットボタンを押すとこうなるように思います。

HDDケーブルが抜けたまま1度でもBIOSが起動したりするとDegradedになります。また一度Degradedになってしまうと、復旧させない限りDegradedのままになります。

Failedとは

Failedについては失念しました。回復不能な障害ということかもしれません。RAID0の障害は回復不能なので、もしかしたらFailedになるように思います。

ディスクの特定

まずはどのハードディスクがどれなのか、実物や配線を確認します。画面に表示される型番とシリアルNoは、ハードディスクのラベルに印刷されています。

写真の例では、Hitachi HDS72202(途中まで) JK11A8B9J5NMMFかJK11A8B9J4ULBFです。2つのディスクのどちらなのかは、[Ctrl]-[I]で管理画面に入るか、後述のMatrix Strage Consoleでわかります。

私は障害対策に懲りたので、こんなラベルを貼りました。(^^;

RAID0 (ストライピング)

RAID0 (ストライピング)

これらはSSDです。RAID0 (ストライピング)でOS用にしています。蛇足ですが、読み込み速度が800MB/S以上出るようになります。

Intel 180GX SATA6GB RAID0

Intel 180GX SATA6GB RAID0

Windowsのロゴが輝きを増す前に起動します。\(^o^)/ ・・・しかしRAIDにするとBIOSの起動に時間がかかりますが。

こちらはデータ用です。

RAID1 (ミラーリング)

RAID1 (ミラーリング)

速度も載せておきます。RAID1 (ミラーリング)だと読み込み速度は遅くなるはすですが体感できません。

Hitachi HDS722020 RAID1

Hitachi HDS722020 RAID1

RAID1の場合はDegradedのまま起動OK

障害がRAID1の場合はDegradedのまま起動させても問題ありません。Windowsは何事もなかったかのように起動しますし、RAID1のディスクへも読み書き可能です。内部的には、Degradedでない方のディスクのみへの読み書きになります。DegradedのディスクはDegradedになる直前のままを維持します。

Degradedのディスクが物理故障しているかどうかを確認します。直前にフリーズしたりリセットしたりしてDegradedになったのであれば物理故障ではないと思います。物理故障していると思われる場合は、一旦PCの電源を落とし、ディスクを他のPCへ接続しましょう。RAID1のディスクを他のPCへ接続しても、単なるディスク増設と同じ扱いです。

ディスクを元に戻してPCを起動します。[CTRL]+[I]でRAIDメニューへ入ると、以下の画面になります。

Menu Degraded

Menu Degraded

[参考] Delete RAID VolumeとReset Disks to Non-RAIDの違い

この2つの違いが分かりづらいので説明します。まずは画面の設定上部にはRAID Volumes (RAIDボリューム)とあり、画面ではRAID0とRAID1の設定があります。その下はPhysical Devices (物理ディスク)とあり、167.6GBのディスクが2つと3.6TBのディスクが2つあります。

Delete RAID Volumeは、物理ディスクに割り当てられたRAID0もしくはRAID1をNon-RAID Disk (RAIDなし)に戻すという意味です。具体的にはこうなります。

作業前

Device Model Type/Status RAID
WD-WCC4ECU2Y15R Memberr Disk(0) Volume_RAID1
WD-WCC4E1LJ0AUR Memberr Disk(0) Volume_RAID1

作業後

Device Model Type/Status RAID
WD-WCC4ECU2Y15R Non-RAID Disk なし
WD-WCC4E1LJ0AUR Non-RAID Disk なし

Reset Disks to Non-RAIDは、物理ディスクに割り当てられたRAID0もしくはRAID1をNon-RAID Disk (RAIDなし)に戻すという意味です。具体的にはこうなります。

作業前

Device Model Type/Status RAID
WD-WCC4ECU2Y15R Memberr Disk(0) Volume_RAID1
WD-WCC4E1LJ0AUR Memberr Disk(0) Volume_RAID1

作業後

Device Model Type/Status RAID
WD-WCC4ECU2Y15R Memberr Disk(0) Volume_RAID1
WD-WCC4E1LJ0AUR Non-RAID Disk なし

作業画面

Non-RAID Diskにするディスクを[Space]で選択し、[Enter]で確定します。同時に複数ディスクを対象にできますが、利用する機会はないと思います。

Reset RAID data

Reset RAID data

作業直後は以下の画面になります。

Degraded volume detected

Degraded volume detected

この画面はRAID1のDegradedを自動認識したという画面です。RAID1のディスクを1つでもNon-RAID Diskにすることは、もう一方のRAID1のディスクにとってはペアだった相手がDegradedしたかのように見えるのです。ここでSelectすると、せっかくNon-RAID Diskにしたディスクが元のRAID1に戻ってしまいます。[ESC]で画面を閉じましょう。

結局どうすればいいのか

ディスク障害があった場合は、まず障害ディスクに対してReset Disks to Non-RAIDを使い、RAID情報をクリアしましょう。そしてPCの電源を切り、ディスクを交換しましょう。

ディスク交換後もしくはディスク障害がない場合は、Recovery Disk OptionsにてRAIDボリュームへディスクを登録しましょう。

RAIDメニューを終了します。StatusはInitializeになります。

RAID Initialize

RAID Initialize

RAIDボリュームの再構築

Windowsを起動します。次にMatrix Storage Consoleを起動します。このソフトは最初にRAIDを構築した際にインストールされているはずです。Windowsを起動するとすでにこのバルーンが表示されているかもしれません。

RAID-Degrading旧Matrix Storage Consoleを起動するとこうなります。

Matrix Strage Manager Console

旧Matrix Strage Manager Console

ステータスが障害発生になっています。×のついているハードディスクがDegradedしているものです。これを右クリックして「正常としてマーク」します。

Matrix Strage Manager 02ステータスが再構築中になります。

Matrix Strage Manager 03バルーンが出ます。

Raid Volume Repairing In Progressバルーンには「RAIDボリュームは再構築されています。データの冗長性は復元されています。」と表示されますが、正しくは「RAIDボリュームは再構築中です。データの冗長性は復元中です。」です。紛らわしい・・・。

2015年位からはIntel Rapid Storage Technologyになっています。操作も簡単になりました。

Intel Rapid Storage Technology

Intel Rapid Storage Technology

図は確かディスク交換後のものです。!マークのディスクが存在していたはずのディスク、その下のディスクが新しいディスクです。ここでは「別のディスクに再構築」をクリックしました。

ボリュームの再構築

ボリュームの再構築

「再構築中 0%完了」になります。×で閉じても作業は進みます。

Intel Rapid Storage Technology

Intel Rapid Storage Technology

いずれのバージョンでも、途中でPCの電源を落としても全く問題ありません。RAID再構築中に再起動するとStatusがRebuildになります。

Rebuild

Rebuild

Windowsが起動した後は再構築作業が再開されます。「RAIDボリュームは再構築されています。」のバルーンがまた表示されます。

再構築は2GBで6時間ほどで完了します。

Raid Structedこのバルーンが出れば再構築完了です。\(^o^)/お疲れ様でした。

RAID1を解除するとどうなるか

StatusがNormalの時にRAID1を解除するとどうなるのかです。RAID0かRAID1に関わらず、RAIDボリュームを削除する時にDELETE VOLUME VERIFICATIONが出ます。

RAID Delete WarninALL DATA IN THE VOLUME WILL BE LOST!と表示されるので勇気がいります。当然RAID0は復活不能ですが、RAID1はミラーリングですので、データは当然残ったままです。RAID1ボリュームを削除しても、ハードディスクは消えません。安心してください。

ではそのまま起動するとどうなるかというと、オフラインで認識します。

RAID1 Volume delete after 01オフラインとは、「オンラインである他のディスクと署名が競合している」という事です。Windowsは認識しているがファイルシステムとして利用を停止しているという意味です。2つあったハードディスクのうち1つだけ使えるという意味です。

もう一方を使いたい場合は、まず1つ目をオフラインにします。

RAID1-Volume-delete-after-02その後、もう2つ目をオンラインにします。RAID1-Volume-delete-after-03もちむん、どちらのディスクでも他のPCへ接続すれば読み込めます。

RAIDケーブルが抜けたままPCを起動するとどうなるか

RAIDコントローラーがハードディスクの抜き差しを確認するのはBIOS起動時からOS起動画面までの間です。PCの電源が切れていれば、ハードディスクを抜き差ししてもRAID構成には影響しません。

RAIDケーブルが抜けたままPCを起動すると、ディスクに障害がない場合でもDegradeになります。一度でもDegradedになると、直すにはリビルドするしかないと思います。

私はラッチがないSATAケーブルを使っていたのですが、ケーブルが抜けてRAIDがDegradedになることが何度もありました。ラッチ付きのケーブルに取り換えてからはケーブルが抜けなくなりました。RAIDにするならラッチがあった方がいいと思います。

RAID0とRAID1は混在できるのか

もちろん使えます。「RAID Initialize」の画像でも混在していますので、確認してみてください。

This post is also available in: 英語

コメントを残す

メールアドレスが公開されることはありません。