HADBノードの再起動と状態確認方法

2007年9月12日 at 4:30 AM





さて本日は、HADBノードの再起動と状態確認方法について説明します。



1. HADBを構成するノードの再起動方法について



前回の説明で、HADBを構成するノード(appserver01,appserver02)を

再起動する際は、両ノード同時にリブートする事は避けて頂きたいと説明しました。

そこで、今回まずは片ノードづつリブートした際における、HADBの状態変化について

説明したいと思います。

片ノードをリブートした際にHADBの状態としてどのように変化するか

下記より確認してみましょう。



正常時のステータス


appserver1 > /sun/SUNWappserver91/hadb/4/bin/hadbm status app-cluster1

Please enter the password for the admin system user:[***********]

Database Status

app-cluster1 FaultTolerant



正常時に“hadbm status”を実行するとDatabaseのステータスとして、

“HAFaultTolerant”(スペアノード付き)もしくは”FaultTolerant”

(スペアノード無し)が表示されます。


この状態で、片ノードに何らかの障害が発生したとします。

するとHADBは単一ノードでしかサービスを提供していませんので、

ステータスは下記のように”Operational”にかわります。


片ノードで起動している時のステータス

appserver1 > /sun/SUNWappserver91/hadb/4/bin/hadbm status app-cluster1

Please enter the password for the admin system user:***********

Database Status

app-cluster1 Operational



実際に、ステータスが変更するかを実際に確認してみましょう。


手順;

1. 初めに片ノード(appserver02)をリブートします。

2. リブートが完了した後、appserver02にログインします。

3. HADBの管理エージェントプロセス(ma)を起動します。

4. 状態の変更を確認します。




appserver2 > sync

appserver2 > reboot



上記の状態で、起動しているノード(appserver01)で

HADBのステータスを確認してみて下さい。

すると下記のようにステータスが変更されている事を確認できます。




appserver1 > /sun/SUNWappserver91/hadb/4/bin/hadbm status app-cluster1

Please enter the password for the admin system user:***********

Database Status

app-cluster1 Operational



次に、システムのリブートが完了した後、システムにログインし、

HADBの管理エージェントプロセス(ma)を起動して下さい。



> ssh -l root 192.168.0.2

パスワード: [********]

Last login: Wed Sep 12 11:17:51 2007 from 192.168.0.10

Sun Microsystems Inc. SunOS 5.10 Generic January 2005

You have new mail.

# tcsh

appserver2 > /sun/SUNWappserver91/hadb/4/bin/ma-initd start

appserver2 > Management Agent version 4.4.3.6 [V4-4-3-6 2007-06-21 17:59:42 pakker@astra07] (SunOS_5.9_sparc) starting

Logging to /sun/SUNWappserver91/hadb/4.4.3-6/log/ma.log

2007-09-12 14:03:43.938 INFO Management Agent version 4.4.3.6 [V4-4-3-6 2007-06-21 17:59:42 pakker@astra07] (SunOS_5.9_sparc) starting

2007-09-12 14:03:43.956 INFO Using property: ma.server.type=jmxmp

2007-09-12 14:03:43.960 INFO Using property: ma.server.mainternal.interfaces=192.168.0.2

2007-09-12 14:03:43.962 INFO Using property: ma.server.dbhistorypath=/sun/SUNWappserver91/hadb/4.4.3-6/history

2007-09-12 14:03:43.966 INFO Using property: ma.server.dbconfigpath=/sun/SUNWappserver91/config/hadb

2007-09-12 14:03:43.968 INFO Using property: console.loglevel=INFO

2007-09-12 14:03:43.969 INFO Using property: logfile.name=/sun/SUNWappserver91/hadb/4.4.3-6/log/ma.log

2007-09-12 14:03:43.971 INFO Using property: ma.server.jmxmp.port=1862

2007-09-12 14:03:43.972 INFO Using property: logfile.loglevel=INFO

2007-09-12 14:03:43.974 INFO Using property: ma.server.dbdevicepath=/sun/SUNWappserver91/hadb/4.4.3-6/device

2007-09-12 14:03:43.975 INFO Using property: repository.dr.path=/sun/SUNWappserver91/hadb/4.4.3-6/rep

2007-09-12 14:03:45.108 INFO Listening for client connections on port 1862

2007-09-12 14:03:45.398 INFO Repository REP:-54e808d5_114ee5e4be0_-8000: Multicast address=228.8.8.8, Port=1862, Bind address=192.168.0.2, Path=/sun/SUNWappserver91/hadb/4.4.3-6/rep

2007-09-12 14:05:14.959 INFO Starting node app-cluster1:1 at level auto, config version 3

2007-09-12 14:05:15.520 INFO n:1 NSUP INF 2007-09-12 14:05:15.518 p:606 Legal realtime priorities are 0 (lowest) to 59 (highest) set it to:29



HADBの管理エージェントプロセスが起動すると、上記のように

メッセージが表示されます。ここで、注意して頂きたいのは

上記のメッセージが表示された直後はまだ、HADBとして

正常な状態には戻っていないという事です。

上記メッセージが出力された直後にステータスを確認してください。

すると、まだ”Operational”の状態になっている事を確認できます。

理由は、前回「High Availability Session Store(HADB)の概要

でも説明致しましたが、appserver01のテーブルの内容と同期を取る

作業等を行っているためです。

そこで、作業完了までしばらく待った後、再度コマンドを実行して下さい。

すると、ステータスが“HAFaultTolerant”/”FaultTolerant”に変わる事が

確認できるかと思います。




appserver1 > /sun/SUNWappserver91/hadb/4/bin/hadbm status app-cluster1

Please enter the password for the admin system user:***********

Database Status

app-cluster1 Operational



…..しばらく時間を経過した後(テーブルの同期が完了した後)



appserver1 > /sun/SUNWappserver91/hadb/4/bin/hadbm status app-cluster1

Please enter the password for the admin system user:***********

Database Status

app-cluster1 FaultTolerant



このように、HADBノードを再起動する際は、片ノードづつ実行して頂き、

片ノードが完全に立ち上がって、HADBのステータスが

“HAFaultTolerant”/”FaultTolerant”の状態に戻った事を確認した後

もう一台のHADBノードを再起動するようにして下さい。


広告

Entry filed under: Application Server/GlassFish.

HADB環境の構築手順 HADBの両ノード障害発生時の復旧方法


Java Champion & Evangelist

ご注意

このエントリは個人の見解であり、所属する会社の公式見解ではありません

カレンダー

2007年9月
« 8月   10月 »
 12
3456789
10111213141516
17181920212223
24252627282930

カテゴリー

Twitter

clustermap

ブログ統計情報

  • 954,732 hits

Feeds


%d人のブロガーが「いいね」をつけました。