2023年3月2日木曜日

ZFS(RAIDZ1)のNAS4Freeのメンテナンス(第1弾)

マーティー工房のメインNASは、2021年8月に
で、新しいハードに載せ替えて
あれから1年以上、特に不自由なく使っていました。
NAS4Free Ver.9.1.0.1でWEB GUIはこの画面です。

あれから再起動してないので
537日も異常なしで頑張ってくれてます。

ある日、ふと、ディスク マネージメントを見ると
何やら赤文字で警告が出ています。
前回修理した時から今まで見たことがなかったのです^^;
ZFSのRAIDZ1という1台壊れてもデータが破損しないという構成で
4台のHDDを1組として動作させています。
その4台:ada0~ada3までの内、
ada1とada2のシリアル番号が赤文字になっているので
どうも新しいハードに載せ替える時に逆に繋いだのかも?

そこで、まずは、新ハードに載せ替えした時の写真で調べます。
各HDDにはマジックで番号を書いていて、
その番号とシリアル番号を照合しましたが、間違っていませんでした。

もしada1とada2を逆につけているのなら
左右にHDDを2台ずつ組み込んでいるので
左側下の「2番」、右側上の「3番」が逆ということになります。

組立時にちと悩んだマザーボードのSATAソケットは
左上に2番のHDD、右下に3番のHDD

この上側のHDD:3番は、
上のマザーボードの右下に繋がっているので間違っていません。
一体、どこで狂ったのだろう?
考えられるとしたら、最初(2013年)に構築した旧ハードの時に
順番が入れ替った間違った結線のまま設定して運用していて
新ハードに組み替えた時に正しい番号で結線して逆になったということか?
旧ハードの時は、あまり写真を撮ってないので、もはや確認できません。

この警告を読むと「消去とインポート」って書いてあります。
色々検索するも、同様の症状の対処法が見つかりません(T_T)
下の[コンフィグ消去とディスクのインポート]ボタンのことでしょう。
コンフィグ消去なのでデータは消えないと思うのですが・・・

単純計算では、3TB HDD x 4台=12TBですが
ZFSでは、パリティを保存する領域が必要になり
RAIDZ1構成なのでデータを格納できる領域は、10.9TBになります。
4台だとRAIDZ2も可能ですが、利用可能領域が更に減るので・・・
箪笥の肥やし的データも溜まって^^;
もう71%の5.67TBも埋まってます。

万が一、データが破損するとマーティーの心も損害を受けるので
バックアップ用の6TBのUSB-HDDを買ってきて
USBで接続しマウントします。

当然、SATA~USBに転送した方が圧倒的に速いので
NAS4Freeのファイルマネージャーでコピーを始めると
進捗状態が表示されず、1時間後位に、途中で失敗になっていました(T_T)
どこまで進んだのか、どこで失敗したのか、どこにも表示されないのです。
FreeBSDベースなのでターミナルでコマンド打てばいいのでしょうが・・・

マーティーは、MS-DOS時代のコマンド
XCOPY /W/S/E/V から進歩していないので
やり馴れた方法を選ぶことにして^^;
追加でマウントしたUSB-HDDをCIFS/SMBで共有設定します。

USBに追加した6TBはUFS Formatすると5.3TBになってしまったので
一部、別のPCのHDDに退避して4.66TBまで減らしました。
別のWindows10マシンから有線の100BaseT経由ででコピーするので
速くて7MByte/sec前後、小さなファイルは、2~3MByte/secで
とても時間がかかります。
少しずつ下層フォルダ単位でコピーしてるので24時間稼働ではないですが
3日かかって30%ってところです(T_T)
この調子だと1週間以上かな~ 先は長そうですが、
その分、6TB USB-HDDがほとんど発熱しないのでまあいいか(^^)

最後は馴れてきたので、約2.5TBのフォルダを一気にコピー!
2023年2月のある朝
昨晩から12時間程かかってやっと15%

丁度2日後の朝
ようやく50%超え

約4日後の昼
残り40GB、約2時間です。

ほぼ5日後
やっと全てのバックアップが終わりました。
2013年からほぼ10年稼働してて
データ破損エラーが全くでなかったのはRAIDZ1のお陰なのでしょう。

さて、問題に取り掛かります。
[ディスク]-[ZFS]-[設定]で
[現在]をクリックすると
デバイス:/dev/ada0, /dev/ada1, /dev/ada2, /dev/ada3

[検出]をクリックすると
デバイス:/dev/ada0, /dev/ada2, /dev/ada1, /dev/ada3
ada1とada2の順番が入れ替わってます。
もしかして[検出]の横の[同期]をクリックするだけでいいのかも?

「消去とインポート」ってやつよりも簡単そうなので
まずは、[検出]の横の[同期]をクリックすると、この画面がでました。
「ディスクの設定を上書き」・・・デフォルトのチェックなし
にして、一番下の[同期]ボタンをえいっ!

一瞬で終わり
[現在]の方も[検出]と同じになりました。
で、[ディスク]-[マネジメント]を見ますが
あの警告は出たままです(T_T)

[同期]をしたページの一番下にあった
『注意 : このページは現在のシステム設定を反映しています。
    コマンドラインで変更を行なっていると、
    WebGUIで作成された設定と違う場合があります。』 
の意味は、どうやら
現在のシステム設定とWEB GUIの表示を合わせるだけみたいですね~
やはり「消去とインポート」の道は避けられないようです。

「消去とインポート」と書いてあるので
下の[コンフィグ消去とディスクのインポート]ボタンを押すことにします。
えいっ!

このボックスがでました。
頭に「本当に」なんてあるとドキドキしますが
バックアップを取ってるので安心して[OK]できます(^^)

一瞬で終わり、赤文字の警告が消えました(^^)
◆ da0:OSのUSB-SanDiskが表示され・・・今までなかったのはなぜだろう?
◆ スタンバイ時間:10 ⇒ 常にオン
が変化した所です。
「ディスクをすべてインポートします。」の注意マーク?が出てるが、何だろう?

ログのシステムやS.M.A.R.Tの所には
コンフィグ消去やインポートの事は何もありません。

再び[ディスク]-[マネージメント]を見ると
さっきの「ディスクをすべてインポートします。」は消えてました。
データも全て残っていて
どうやら何事もなく無事に終わったようです(^^)

スタンバイ時間:10 ⇒ 常にオン に変わっているので
設定のバックアップで元に戻すことにします!

「リストア後、リブートします」かあ~
再起動するとIPアドレスの設定がうまくいかないので
起動後、サーバーの直付キーボードでIPアドレスを再設定するまで
WEB GUIが使えなくなる問題は解決してないのです。

そのために隣の37inchプラズマTVにHDMIで繋いでたのに
なぜか映像が出力されないのです(T_T)
このプラズマTV、ご老体なので、たぶん今年は買い替えかな?
結局、NASにRGB I/FのLCD Displayを付けて

キーボードは、左右・数字・BackSpace・ENTERだけでいいので
再起動時用に小型のUSB テンキーを繋いでます。

立ち上がったら、Console Menuから
2) Configure Network IP Address に進んで
設定している元の固定IPアドレスを

一旦、別の固定IPアドレスにすると、

ネットワークに繋がるようになります。

その後で、再度、設定している元の固定IPアドレスに戻せば、

元のIPアドレスでネットワークに接続できます。
今の所、再起動した時の必須の儀式になってるのです(T_T)
ん? 「https:」でなく「http:」だ、なんで?
リストアした後は、「http:」に戻る仕様なのか?

もう一度、やってると
途中のここで、うっかり「Yes」にしてました^^;
ここを「No」にしないと「https:」になりません。

今度は「No」にしたので「https:」になってます(^^)

無事 WEB GUIにアクセスできるようになったら
もう一つ、再起動する毎にやらねばならないことがあります。
FTPのステータスが、まだ「」なので

FTPだけを再起動します。
システム全体を再起動するわけではないので、
ネットワークに繋がらない問題は発生しません。

ほぼ一瞬で再起動が完了します。

これでFTPのステータスが、まだ「」になって
マーティーが利用しているサービスは全て動作中になります(^^)

無事、いつも通りWEG GUIにアクセスできたので
[ディスク]-[マネジメント]を見ると
あれ~???
また、この警告が復活してる~(・。・)
どうやらディスクのコンフィグ情報も保存されてて
リストアされた様ですね~(T_T)
再度、下の方の[コンフィグ消去とディスクのインポート]ボタンを押します。

また、この画面になるので
スタンバイ時間:10 ⇒ 常にオン に変わったのを
元に戻すところからやり直しです。

それぞれのディスク毎に右端のスパナアイコンで設定に行きます。

まずは、ada0のスパナアイコンをクリックして
デフォルト状態になっているので

[ハードディスクスタンバイ時間]:10分
[高度な電源管理]:レベル1 スタンバイ(スピンダウン)の有る最小の消費電力
[音響レベル]:最小のパフォーマンス、最小の音響出力
にして
[S.M.A.R.T]の「このデバイスのS.M.A.R.T機能を有効にする」にチェック
一番下の[保存]ボタンを押します。

ada0のスタンバイ時間:10、ステータス:修正 になります。
同様に全てのディスクの設定をします。

全部終わりました。
ステータスが全て「修正」になっています。
最後に[変更の適用]ボタンを押すと

30秒ほどでステータスが「オンライン」に変わりました。

ひとまずここで設定のバックアップを取っておきます。
・・・ちゅーか、なぜ上記の設定は保存されないんだろう?
他にも保存されない設定がありそうで心配になるな~

いや~
終わってみれば、全然大した事ない作業だったのに
えらく時間を食ってしまいました(-_-;)

元々バージョンアップもしようと思ってバックアップしたので
早いとこバージョンアップしたいのですが
Ver. 9.1.0.1では、WEB GUIからUpgradeできないので、
その手順から調べないといけないし~
ちと面倒になっております(-_-;)
滅多にやらない再起動時のIPアドレスの問題はまだしも
せめて、CPU周波数が負荷に応じて変化して欲しいですね~

0 件のコメント: