トップ «前の日記(2020年10月09日) 最新 次の日記(2020年11月24日)» 編集

xiphioの備忘録


2020年10月22日

_ [computer] FreeNAS、障害でフリーズ

先日夜、普通にパソコンを使っていました所、急にFreeNASで運用しているNASからの反応が全く無くなりました。これは、オークションで手に入れた中古のHPのMicroServerGen8に、FreeNAS(Ver11)を入れて仕立てた物で、3TのHDDを2台入れてミラーリングで運用中でした。

早速、FreeNASの管理画面にアクセスしますが、そちらも全く反応がありません。仕方が無いので、電源強制断にて、場所を変えてモニターを付けて起動してみますと、最初は普通に立ち上がるのですが、暫くすると(2、3分)コンソールにエラーメッセージを出して、その後はハングアップしたみたいに、フリーズしてしまいます。モニタ出ているのは、何とか何とかATAステイタスエラー、とかでして、何やら延々と何度もリトライしている程です。

ハングアップする前に確認した、FreeNASのアラートメッセージでは、ada1が少し前から怪しいみたいです。それで、そのHDDの障害だろうと、ada1と思われるHDDを抜いて再起動させました。HDDスロットの一番左が起動用の小容量のSDDでada0なので、その隣がada1だと思い込んでいました!。(後で思えば、これが最大の失敗でした。)

再起動後、それでも症状が治らないので、OSのFreeNASがおかしくなったか、MicroServerのハード的な問題化と判断し、翌日、最新のFreeNAS11.3を別にインストールして、こちらで立ち上げてみたり、新しいHDDを加えたり、スロットのを場所を変えたり、、色々やってみたあげくに、実は問題が有るHDDは他方の方だとやっと気がつきました。

それで、今度はその障害認定のHDDをはずして、他方のHDDのみで立ち上げると無事マウントされ、、「そうだったか、でもこれでOK」と思ったのですが、、データセットはちゃんとあるのですが、見たところ何故だか中身がすっかり空になっていました!!。理由は不明ですが、トラブって色々やったのが、なんだか悪かったみたいです。試しに障害HDDのみで立ち上げると、こちらにはデータは残って居る様に見えますが、暫くするとやはりATAエラーがでて、アクセス不能に陥ります。この時点で、復旧はほとんど諦めかけました。幸い、2月のデータ移動時に取ってあったバックアップがあるので、最悪その時点になら戻す事が可能です。

その時ふと、新しいHDDの確認に使ったHDDスタンドを見て気がついたのが、これはHDDクローンを作る機能が有ると言う事です。ATAエラーってなんだか判りませんが、記憶領域の障害では無く動作転送時のエラーっぽいので、もし「無理にでもクローンを作れれば」何とかならない?、と思い、ダメ元でやってみました。

障害HDDからの未使用HDDへのクローン化なので、案の定HDDスタンドのエラーランプが最初から点きっぱなしです。これで、コピーの進捗が全く無い様ですと、もうどうしようも無いのですが、こうなったらどうせ他の解決法も浮かばないので、1日くらいはそのまま放っておくつもりでした。その後、何時間か経つと50%完了のランプがともりました。どうやら、少しずつは何かやってくれて居るみたいです。

翌日、クローンが完了したHDDを付けて立ち上げたところ、、おお、ちゃんとデータが見れました。暫くしてもエラーも出ずアクセス出来ます、素晴らしい!。これで、ミラーリングの他方のHDDを追加して同期・再構築させれば、それでもうOKと思い、早速同じ3TのHDDを追加して立ち上げ、ReSilver(Raidの再構築)をかけて、それ自体は終わったのですが、、その後のスキャンみたいな作業が終わらない。

暫く放置してから見てみると、今度はクローンで作ったHDDがエラーでシステムから外されてしまいました。障害のあるHDDを、エラーが出ながらも無理矢理クローン作ったのですから、仕方ないかも、、。もうここは、まずデータが見えている内にとりあえずバックアップと言う事で、急遽既に使って居ない古いMicroServerにあり合わせのHDD装着しFreeNASを入れ、そちらにrsyncでバックアップ。その後現行のこのMicroServerGen8を立て直して戻しますが、これを期にFreeNASも最新の11.3を新規に入れ直して、HDDも綺麗にフォーマットし新たに作り直してからセットアップし、その後バックアップの方からrsyncでレストアしました。

一応、これでやっと復帰しました。ちなみに、障害のあったHDDですが、Windowsでは普通にフォーマット出来て問題無く使えるみたいなので、試しにFreeNASに戻してみた所、フリーズこそしませんが、やはりエラーのせいで使用可能なHDDとして登録できませんでした。Windowsでは普通に使えるのですが、、何処が悪いのだか??

新しく入れ直したFreeNASでの設定ですが、何度かやっている筈なのですが、その都度忘れてしまうので、今回もまた、きりしま屋さんのHPを参考に進めました。データレストア後に、その他の設定を進めましたが、Mailを送る設定だけが上手くゆきません。

gmailを使ってアラートメールを送りたいのだけど、送信サーバsmtp.gmail.com、ポート465、SSL、ユーザーメールアドレス、パスワード、と設定しても失敗します。以前の設定はどうやったのか、既に覚えていない、、。でも確か今回の障害の時、管理画面では確か夏ぐらいからエラーの警告は出ているのに、そのアラートメールは届いていなかった。

どうやってもmailが送れないので、パスワード合ってるよね、とGmailから一度ログアウトして再度ログインしようとしたら、安全性の低いアプリからのアクセス、、云々、、と言うメッセージ、え、何それ、、。

という事で、Googleのアカウントからセキュリティ項目で、「安全性の低いアプリからのアクセス」を許可したら、無事Mailが送れました。何時からこうなったのか不明ですが(gmailのセキュリティ強化の為でしょうが)、多分そのせいでFreeNASからのアラートメールがずっと届かなかった様です。ちなみに、市販NASのQNAPやSynologyはちゃんとgoogleに登録されて居るみたいで、「安全性の低いアプリ」に入らない模様。

まぁ、ここ数日、夜までこの事にかかりきりでした。何とか復帰出来て良かったですが、もしかしたら壊れてしまったファイルも有るかも知れません。しかし何が悪いって、最初に障害HDDを取り違えたのが、全ての元凶でした。FreeNASでは、どのドライブかはシリアルで判断する、って聞いていたのですが、思い込みで作業したのが大失敗でした。今回の状況として、初期にはFreeNASの管理画面もまともには動かなかったので、シリアルの確認なども出来なかったので、疑いもせずやってしまった訳ですが、でもまさか0-2-1の順になっているとは思いませんでした。