リカバリ サブシステム

以下のリカバリ サブシステムから1つを選んで詳しい情報を参照してください。

リブート オプション

自動サーバ復旧

クリティカル エラー

パワー オン メッセージ

訂正可能メモリ

環境

パワー サプライ

パワーコンバータ

リモート通信

インテグレーテッド マネジメント ログ

リモート Insight

リブート オプション

このオプションを使って、ブラウザからリブートを開始できます。システムがリブート プロセスを続行する前に警告が表示されます。次のリブート オプションを使用できます。

デバイスをリブートするには、リブート オプションを選択して、リブートをクリックします。リブートが正しく要求されたことを示すテキスト メッセージが表示されます。

注: リブート オプションは、すべてのデバイスで利用できるわけではありません。

自動サーバ復旧

このウィンドウは、自動サーバ復旧(ASR)コンフィギュレーション情報を表示し、サーバの前回のリセット時刻を表示します。また、ステータス、ASRリセット ブート オプション、ポケットベル ステータス、ポケットベル ダイヤル コマンド、およびポケットベル メッセージの変更もできます。

次の項目がこのウィンドウに表示されます。

一般情報

前回のリセットがASRリセットであった場合、 ASR条件が劣化します。

この設定を変更するには、Compaqシステム コンフィギュレーション ユーティリティを使います。この項目に設定する時間は、障害が発生した後システムのリセットおよび復旧処理を行うまでの余裕を取るための時間になります。このタイムアウト時間が、利用負担の大きいサーバで低すぎる値に設定されると、ソフトウェア サポートがタイマに応答できない間にタイムアウトが発生してしまうおそれがあります。

リブート

ASRリセット リミット機能は、同じウィンドウのASRリセット カウント機能と一緒に使用します。ASRリセット カウント機能は、サーバをリブートした回数を示します。ASRは指定回数までリブートを行うので、ASRリセットカウントが指定回数に達したときは、クリティカル エラー ログのチェックおよびCompaq Diagnosticsプログラムの実行により、直ちにサーバの問題を調査してください。

このカウンタは、システムが手動でリセットされると0に戻ります。

ポケットベル

表示されるステータスは以下のとおりです。

クリティカル エラー

クリティカル エラー ログは、システム障害の原因になるハードウェア、ソフトウェアの危機的なエラーに加えて、訂正不可能なメモリ エラーを記録します。この情報により直ちに問題を確認して修正できるので、停止時間が最小限にとどまります。

このウィンドウは、クリティカルエラーの内容を表示します。エラーの日付、時間のあとに簡単なエラーの内容が続きます。時間は近似時間にまとめています。

訂正処置が必要であることを示すマークがクリティカル エラーに付いている場合、ログは劣化状態にあります。これは、[高速復旧]ウィンドウ内の[クリティカル エラー ログ]ボタンを囲む黄色の枠で示されます。Compaq Diagnosticsプログラムをサーバ上で実行して、感嘆符の表示を消して訂正を実行したことを示してください。アスタリスク(*)は、前回の障害メッセージが適用されたログ内容であることを示します。


重要: エージェントでSETを有効にして、エントリを訂正済みとしてマークできる訂正済みSNMPコミュニティ ストリングが必要です。


以下のリストは、記録されたエラーを示します。この内のいずれかのエラーを受けた場合は、Compaq Diagnosticsプログラムをシステムで実行するか、ソフトウェアの説明書を参照してください。

異常プログラム終了 -サーバは致命的なソフトウェア エラーを検出しました。サーバ障害の原因になります。

自動サーバ復旧(ASR)ベース メモリ パリティ エラー - システムは、自動サーバ復旧(ASR)のタイムアウトによるリセットに続き、ベース メモリにデータ エラーを検出しました。

自動サーバ復旧(ASR)拡張メモリ パリティ エラー - システムは、自動サーバ復旧 (ASR)のタイムアウトによるリセットに続き、拡張メモリにデータ エラーを検出しました。

自動サーバ復旧(ASR)メモリ パリティ エラー - システムROMは、スタックを作成するために十分なメモリを割り当てられませんでした。メッセージを画面に表示できず、サーバの起動も続行できませんでした。

自動サーバ復旧(ASR)リセット リミット オーバー - システムの最大リセット回数がオーバーしました。Compaqユーティリティがロードされます。

自動サーバ復旧(ASR)リセット発生 - エラー データは記録されません。

自動サーバ復旧(ASR)テスト イベント - 自動サーバ復旧(ASR)テスト イベントが、システム ユーティリティから発生しました。これはASRコンフィギュレーションをテストするユーザによるもので、処置作業は不要です。

自動サーバ復旧(ASR)タイムアウトNMI - 自動サーバ復旧(ASR)タイマのドライバ リフレッシュがなかったため、サーバがASR NMIを発生しました。通常これは、ドライバがプロセッサの制御を放棄しなかったことを示し、サーバ障害の原因になります。結果としてASR NMIが発生し、このイベントを記録しました。実行モジュールを記録してください。

CPU内部訂正可能エラー スレッショルド超過 - システムが、CPUが内部キャッシュ エラー数のスレッショルドを超過したことを検出しました。

CPU プロセッサ パワー モジュール障害 - システムが、プロセッサ パワー モジュールの障害を検出しました。

異常温度 -温度異常の限界を超えました。自動シャットダウンを開始しました。

起動時に検出されたエラー - システムがPOSTエラーを検出しました。

例外 - プロセッサはクリティカルな例外を検出しました。サーバ障害の原因になります。

ファン障害 - システムまたはプロセッサのファンに障害があります。

NMI - CPUローカル エラー - プロセッサに致命的なエラーがありました。サーバ障害の原因になります。

NMI - 拡張ボード エラー - 拡張バス上のボードが、サーバ障害の原因となるエラー状態を示しました。

NMI - 拡張バス アービトレーションエラー - データ喪失の原因となる、メモリのリフレッシュ サイクルの遅れが発生しました。このエラーはシステム障害を引き起こします。

NMI - 拡張バス マスタ タイムアウト - 表示されているスロットのバス マスタ拡張ボードは、設定最大時間後になってもバスを開放しませんでした。サーバ障害の原因になります。

NMI - 拡張バス スレーブ タイムアウト - 拡張バスのボードのバス サイクルは、最大時間を超えて遅れました。サーバ障害の原因になります。

NMI -フェイル セーフ タイマ期限 - ソフトウェアはシステムのフェイルセイフ タイマをリセットできず、システム障害になりました。

NMI - プロセッサ アドレス エラー 1 - プロセッサ内部アドレス パリティ チェック エラーが発生しました。サーバ障害の原因になります。

NMI - プロセッサ アドレス エラー 2 -プロセッサは、問い合わせサイクル中にアドレス パリティ エラーを検出しました。

NMI - プロセッサ キャッシュ パリティ エラー -プロセッサ キャッシュにデータ エラーが発生しました。システム障害の原因になります。

NMI - プロセッサ内部エラー 1 - プロセッサの内部パリティエラーが発生しました。サーバ障害の原因になります。

NMI -プロセッサ内部エラー 2 - プロセッサが、内部パリティエラーまたは機能重複エラーを検出しました。

NMI -プロセッサ パリティ エラー - プロセッサは、データエラーを検出しました。サーバ障害の原因になります。

NMI -ソフトウェア割り込み - ソフトウェアはシステムエラーを示しました。システム障害の原因になります。

NMI - システム コンカレンシー エラー - データ フロー マネージャに、エラー状態が検出されました。システム障害の原因になります。

NMI - 訂正不能メモリ エラー - サーバに訂正不能なメモリ パリティ エラーがありました。サーバ障害の原因になります。

NMI -エラー タイプ不明 - デバイス ドライバは、このNMIを認識しません。ユーザのサーバ ヘルス ドライバを更新する必要が考えられます。

プロセッサ障害 - プロセッサはセルフ テスト中に障害を起こしました。

サーバ マネージャ障害 - サーバ マネージャ/Rを内蔵したサーバ インタフェースに、エラーが発生しました。

UPS(無停電電源装置)のAC電源障害/シャットダウンまたはバッテリー低下: サーバは、UPS(無停電電源装置)またはオペレーティング システムのシャットダウンを開始しました。バッテリーはAC電源障害の後、ほとんど消耗しています。

前回の障害メッセージは、クリティカル エラーに関連する前回の障害メッセージを表示します。

パワーオン メッセージ

このウィンドウはサーバの電源が入ると、パワーオン メッセージを表示します。サーバの説明書にあるパワーオンエラー メッセージとその内容を参照してください。 パワーオン メッセージの消去ボタンをクリックすると、パワーオン メッセージのログをクリアできます。このボタンは、ログにメッセージが残っている場合にだけ使用できます。

訂正可能メモリ

このアラートは、メモリの1ブロックが障害を起こしたか、現に障害を起こしつつあり、すぐ交換しなければならないことを示します。メモリ コントローラが問題を解決できるため、この状態はすぐさま重大な事態にはつながりませんが、この種のエラーはアラートが発生したデバイスでメモリ部品が障害を起こしつつあるか、すでに起こしたことを示しています。システムは引き続き、可能な限りエラーの訂正を続けます。

メモリ エラーが発生すると、アドバンストECCがエラーを訂正します。これらのエラーが増加していることに気づいたら、できるだけ早いうちに問題を修正します。メモリモジュールの劣化が進んで、エラーを訂正できなくなる可能性があります。

環境

この項にはデバイスの環境情報が表示されます。このウィンドウに表示されるのは、以下の項目です。

システム情報

注意: カバーを取り外したままでシステムを動作させないでください。カバーが正しい位置に取り付けられて、しっかりと固定されている場合にのみ正しい通気が確保されます。

注: 温度条件が継続的な障害を引き起こすレベルに達すると、クライアントの電源は切断されるため、クライアントPCで障害を引き起こす温度条件は発生しません。

パワー サプライ

この項では、パワー サプライについての情報を表示します。

以下のエントリが表示されます。

パワー コンバータ

この項には、パワーコンバータについての情報が表示されます。表示されるエントリは以下のとおりです。

リモート通信

この項には、内蔵リモート コンソール(IRC)およびリモート通信によるサーバ復旧の詳細設定が表示されます。

以下の項目がウィンドウに表示されます。

ステータスこのフィールドには、内蔵リモート コンソール(IRC)がサポートされて、有効になっているかどうかが表示されます。表示される値は、[サポートされていない]、[有効]、[無効]のいずれかです。

  1. IRC用に設定されたCOMポートがない。

  2. IRC用に設定されたCOMポートがPCIデバイスである。

  3. IRCのIRQがCOMポートのIRQと一致しない。

CompaqユーティリティへのリモートPC通信

表示される値は以下のとおりです。

ダイヤルアウト ステータスを有効にした場合、最初にダイヤルアウト接続が試行されます。この接続が失敗すると、ダイヤルイン アクセスが有効になります。ダイヤルアウト接続が正常に確立された場合、この接続が終了したあとにダイヤルインが有効になります。

自動サーバ復旧(ASR)機能がポケットベルを通してアラートを通知した後、ダイヤル アウト ステータスが有効で正しいダイヤル アウト ストリングが設定されている場合は、ASRはリモートPCにダイヤルします。ダイヤルが通じると、サーバ管理者はサード パーティ製のエミュレーションプログラムを使ってCompaqユーティリティを実行し、問題箇所を診断できます。

表示される値は以下のとおりです。

自動サーバ復旧 (ASR)がポケット ベルを通してアラートを通知した後、ダイヤルアウトステータスが有効で正しいダイヤルアウトストリングがこの項目に設定されている場合は、ASRはリモートPCにダイヤルします。ダイヤルが接続すると、サーバ管理者はサード パーティ製の端末エミュレーションプログラムを使ってCompaqユーティリティを実行し、問題の箇所を診断できます。

インテグレーテッド マネジメント ログには、システムのイベント、重大なエラー、POSTエラー、およびメモリ エラーが記録されます。また、システムがダウンする原因になる重大なハードウェアおよびソフトウェア エラーも記録されます。これらの情報は、問題をすばやく見つけて訂正し、システムのダウン時間を小さくするのに役立ちます。

イベント ログ エントリには、イベントの重要度を知らせるステータスが表示されます。

ログ内のイベントが「注意」の状態にあるとき、ログ全体の状態は劣化状態になります。ログ内に重大なエラーがある場合、ログ全体の状態は障害状態になります。

劣化したイベント ログおよび障害のあるイベント ログをクリアするには、これらのログ エントリを発生させた原因を訂正した後、ログ エントリに訂正済みのマークを付けます。以下の手順に従ってください。

  1. インテグレーテッド マネジメント ログのログ エントリを強調表示します。

  2. 訂正済みマーク ボタンを選択します。このボタンはウィンドウの上の方にあります。


重要: エントリに訂正済みマークを付けるには、エージェントでSETパラメータを有効にして、正しいコミュニティ名を設定しなければなりません。


説明欄にエラーまたはイベントの簡単な説明が表示されます。更新時刻欄には、ログが更新された時刻が表示されます。ステータス欄には、ログ エントリのステータスが表示されます。

詳しくは、「Compaq内蔵リモート コンソール ユーザ ガイド」を参照してください。

リモートInsightボード

リカバリ リストからリモートInsightボードを選択して、一般情報、ネットワーク インタフェース カード、イベント ログ、およびリモートInsightボードWebインタフェースへのリンクなどがあるサブメニューを表示します。

一般情報

ネットワーク インタフェース カード

イベント ログ

リモートInsightボードWebインタフェース

一般情報

一般情報の項には、リモートInsightボードに関する以下の項目が表示されます。以下の項目は、リモートInsightボードのすべてのモデルでサポートされているわけではありません。

ネットワーク インタフェース カード

NICの項には、リモートInsightボードのNICに関する以下の情報が表示されます。リモートInsightボードおよびNICのすべてのモデルでこれらの項目がすべてサポートされるわけではありません。

イベント ログ

イベント ログの項には、リモートInsightボードに保存されているイベントのリストが表示されます。これらのイベントは、権限を持つユーザが消去できます。 各イベントには、以下の情報が含まれています。

リモートInsightボードWebインタフェース

このリンクを使って、リモートInsightボードのWebインタフェースを起動できます。このリンクを使えるのは、WebインタフェースをサポートするリモートInsightボードだけです。