|
xSeries関連の障害に際し、少しでも早い原因究明と解決のためにお役立て下さい。
このマニュアルで解説されている内容は、単に障害復旧の為のノウハウには留まりません。
あるコンポーネントが障害を起こしたときに、サーバーを構成するハードウェアやOS(S/W)の観点からどういった原理で起こっているのかを、主コンポーネント毎に技術的な解説を試みています。

TAPE 関連 -PD虎の巻 Vol.2-
テープドライブが障害を起こした場合の症状としては以下のようなものが考えられますが、テープドライブ以外の理由でこのような症状が起こることも多く見受けられます。ここでは、このような症状が現れた場合に、テープドライブ自身の障害との切り分けを行うための手順について記述します。
[1] テープドライブがSCSI アダプターから認識されない。
テープドライブ自身の障害と区別するために、SCSI ケーブル、電源ケーブルが正しく接続され、SCSI バスのターミネーシヨンが正しく行われており、SCSI ID の競合がないことを確認して下さい。
また、Narrow SCSI (50 ピン・コネクター)のドライブをWide SCSI アダプター(68 ピン・コネクター)に接続して使用する場合は、「Initiate Wide Negotiation」を「Disable」に設
定する必要があります。
最近ではLVD SCSI 仕様のドライブに移行してきており、これらのドライブはドライブ側でターミネーションできませんので、必ずLVD 対応ターミネーター付きSCSI ケーブルを使用して下さい。
[2] テープドライブがバックアップ・ソフトウェアから認識されない。
テープドライブ自身の障害と区別するために、SCSI ケーブル、電源ケーブルが正しく接続され、SCSI バスのターミネーシヨンが正しく行われており、SCSI ID の競合がないことを確認して下さい。SCSI バスは信号の品質を保持するために適切なターミネーションが必要です。SCSI バスのターミネーションは、SCSI バス上の最後のデバイス又はSCSI ケーブル上の最後のコネクターにターミネーターを取り付けることにより行われます。サーバーのSCSI ケーブルには、ケーブル末端にすでにターミネーターが付いている場合があります。この場合はターミネーターを追加しないで下さい。
また、内臓オートローダーDAT ドライブのようにSCSI ID だけでなくSCSI LUN (Logical Unit Number)を使用しているドライブの場合は、SCSI アダプターの「Multiple
LUN Support」を「Enable」に設定する必要があります。
次に、適切なデバイス・ドライバーが導入されていることを確認して下さい。
例えば、ARCserve を使用する場合は、デバイス・ドライバーはARCserve に含まれていますので、導入時にデバイス・ドライバーも自動的に導入されますが、BackupExec やNTbackup を使用する場合は、別に導入する必要があります。
Windows NT では、コントロール・パネルの中のテープデバイスの中で導入し、Windows 2000 では、デバイスマネジャーの中で導入します。なお、ARCserve のようにバックアップ・ソフト自身がデバイス・ドライバーを含んでいるものは、サポートするデバイスモジュールが適時更新されパッチ形式で配布されていますので、必要に応じメーカーのWeb サポートページから入手し適用する必要があります。
[3] バックアップ、リストアが失敗する。
バックアップ障害はドライブの故障だけでなく、テープパス(特にヘッド)の汚れによっても起こることがあります。これは、外部からの埃、塵だけでなく、テープ表面から剥離した磁性体がヘッド等に付着することにより読み取り、書き込み性能が低下し引き起こされるものです。
これを避けるため、クリーニングテープによるクリーニングを定期的に行うことが推奨されています。多くのテープドライブはクリーニングが必要であることを知らせるインディケーター又はメッセージが用意されていますので、これらが表示された時はクリーニングを行ってください。
尚、クリーニング・テープには使用回数が規定されているものがあり、規定回数以上使用すると効果がありませんので、これらのクリーニング・テープを使用している場合は、使用の都度必ずチェックしておく必要があります。
使用するテープカートリッジは同じ規格のものでも、その性能はメーカーにより差がありますので、極力IBM が提供しているテープカートリッジの使用を推奨します。また、テープカートリッジは長時間の使用により性能が劣化しメディアエラーとなり得ますので、このような症状が出始めましたら新しいテープカートリッジに交換し動作確認して下さい。
IBM としての推奨テープメディアリストをWeb に公開しており、以下のURL にて確認できます。
「http://www-3.ibm.com/pc/support/site.wss/document.do?lndocid=MIGR-39931」
バックアップ障害は使用しているドライブ故障で発生することが大半と考えられますが、オープン環境で様々な形態で使用されると予期せぬ問題が顕在化することもあり、ドライブを制御するファームウェアの修正も適時行われていますので、間歇障害のような場合にはまず最新のファームウェアに更新することを推奨します。
IBM としては「IBM Tape Tool CD (UpdateXpress CDに統合) 」を定期的に更新し、最新のファームウェアを提供しています。このCD イメージはIBM Web サイト
からダウンロードできます。
尚、この「IBM Tape Tool CD(UpdateXpress CDに統合)」には最新ファームウェアの提供だけでなく、その更新履歴情報や、診断ツールも収められています。
以上をまとめるとテープドライブの基本的な保守手順は以下のようになります。
1) クリーニングテープによるクリーニングの実施
2) テープカートリッジの交換
3) ドライブファームウェアの更新
4) ドライブの交換
[4] バックアップに異常に時間がかかる。
バックアップ時間は合計のファイルサイズが同じでも、そのファイル・グループが多くの小さいファイルによって成り立っている場合は、少数の大きなファイルによって成り立っている場合と比べると長くなります。また、SCSI バスが正しくターミネーションされていない場合や、テープメディアの消耗、読み書きヘッドの汚れなどにより、リトライが頻発し、結果として処理速度が低下するというようなことも考えられます。
また、バックアップソフトやSCSI ドライバーに起因することも考えられますので、Web等で更新の確認をし最新の状態に保つことも肝要です。
過去の事例としてWindows 2000 環境で「Adaptec Ultra160 SCSI ドライバーに起因して処理速度が低下する」という事例もあり、Windows 2000 標準のドライバーかAdaptecサイトから最新のドライバーを入手して適用することにより解決しています。
また「Windows 2000 標準のバックアップツールを使用すると処理速度が遅い」という事例もあり、サービスパック4 にて解決しています。この事例は、テープに書き込む単位であるブロックサイズが1KB と小さくなってしまうことに起因しています。使用ドライブやアプリケーションにもよりますが、一般的には32KB,64KB というようなブロックサイズとなります。この事例のもう一つのこととして、一度1KB ブロックで書き込まれたテープはソフトを修正しても、一度そのテープを消去しない限り1KB ブロックで書き込み続けるため修復してないように見えたということもあります。
テープドライブの多くの機種では、自己診断機能が提供されており、障害を検出した時にエラーコードを表示したり表示ランプの色や明滅で知らせる機能をもっていますので、ユーザーズ・ガイドを参照し、障害の切り分けに役立てることができます。
以下は代表的なドライブの前面パネルLED の例です。
(1) 20/40GB DDS/4 4mm Internal Tape Drive の前面パネルのLED の例です。
LED の名称 状態とその意味
------------- ------------------------------------------------------------
ドライブ動作中 オン : テープに対して読み書きを行っています。
(琥珀色) 明滅 : ハードウェア障害が発生しました。
テープ使用可能 オン : テープがロードされ使用可能です。
(緑色) 明滅 : テープのエラーです。クリーニングを実行して下さい。引き続き
エラーが発生する場合はテープを交換して下さい。
クリーニング オン : クリーニングが必要です。
(緑色) 明滅 : クリーニングが必要です。
(2) 40/80GB HH DLTVS Internal Tape Drive
LED の名称 状態とその意味
------------- ------------------------------------------------------------
ドライブエラー 明滅 : 回復不能なハードウェアエラー又はPOST エラーの発生。
(琥珀色) オフ : エラーはありません。
レディ オン : 電源が供給されています。
(緑色) オフ : 電源が供給されていません。
明滅 : テープが動作中です。
クリーニング 明滅 : クリーニングが必要です。
(緑色) オフ : クリーニングが必要ではありません。
三つ全て オン : POST 実行中
明滅 : ファームウェア更新中
(3) 100/200GB HH LTO Internal Tape Drive
LED の名称 状態とその意味
------------- ------------------------------------------------------------
レディ オン : ドライブ使用可能
(緑色) オフ : ドライブの電源が切られているか、POST でエラーがあった。
明滅 : ドライブ使用中
ドライブエラー オフ : エラーはありません。
(琥珀色) 明滅 : ハードウェアエラーが起りました。
テープエラー オフ : エラーはありません。
(琥珀色) 明滅 : テープ関係のエラーが起っています。テープカートリッジを交換
して下さい。
クリーニング オン : クリーニングカートリッジ使用中
(琥珀色) オフ : クリーニングの必要はありません。
明滅 : クリーニングをして下さい。
| 文書番号: SYJ0-00588A0 |
| 最終更新日: 2006-07-13 |
| Copyright © 2006 IBM Corporation |
|