{AJS構築}15.2.12 エージェントの障害回復待ち時間を短縮する設定方法

  • 物理ホスト


--設定
/opt/jp1ajs2/bin/jajs_spmd_stop
/opt/jp1ajs2/bin/jajs_spmd_status

--マネージャで設定
/opt/jp1ajs2/bin/jajs_config -k "[JP1_DEFAULT\JP1AJS2\SCHEDULER\QUEUE\MANAGER\Job]" "QueuingJobRecoveryTime"=dword:0000001E
/opt/jp1ajs2/bin/jajs_config -k "[JP1_DEFAULT\JP1AJS2\SCHEDULER\QUEUE\MANAGER\Job]" "ExecutingJobRecoveryTime"=dword:0000001E

/opt/jp1ajs2/bin/jajs_spmd
/opt/jp1ajs2/bin/jajs_spmd_status

 


--動作確認
vim /root/job1.sh

#!/bin/bash

date >> /root/job1.log


vim /root/unitbackup.txt

unit=jg1,,jp1admin,;
{
ty=g;
cm="jg1";
el=jobnet1,n,+0+0;
cl=su;
op=mo;
op=tu;
op=we;
op=th;
op=fr;
cl=sa;
unit=jobnet1,,jp1admin,;
{
ty=n;
cm="jobnet1";
sz=10x8;
el=job11,j,+80+48;
sd=1,2019/11/03;
st=1,23:58;
cy=1,(1,d);
sh=1,ca;
shd=1,2;
ex="mmm182";
unit=job11,,jp1admin,;
{
ty=j;
cm="job11";
sc="/root/job1.sh";
so="/root/1";
se="/root/2";
un="root";
tho=0;
ex="mmm182";
}
}
}

 

export JP1_USERNAME=jp1admin
/opt/jp1ajs2/bin/ajsleave -F AJSROOT1 /jg1/jobnet1
/opt/jp1ajs2/bin/ajsdefine -F AJSROOT1 -f -d / /root/unitbackup.txt
/opt/jp1ajs2/bin/ajsprint -F AJSROOT1 "/*"

ジョブ開始前にエージェントのインタフェースをdownさせる

/opt/jp1ajs2/bin/ajsentry -F AJSROOT1 -n /jg1/jobnet1


while true;do
/opt/jp1ajs2/bin/ajsshow -F AJSROOT1 -R /jg1/jobnet1
date
sleep 1
done

統合トレースログ確認
ls -ltr /var/opt/hitachi/HNTRLib2/spool
tail -f /var/opt/hitachi/HNTRLib2/spool/hntr24.log

デフォルト設定の場合
→約10分後に異常終了

 

最小値に設定した場合
→約1分後に異常終了

 

 

  • 論理ホスト

--設定
/etc/opt/jp1ajs2/jajs_stop.cluster mmm190
/opt/jp1ajs2/bin/jajs_spmd_status -h mmm190

--マネージャで設定
/opt/jp1ajs2/bin/jajs_config -k "[mmm190\JP1AJS2\SCHEDULER\QUEUE\MANAGER\Job]" "QueuingJobRecoveryTime"=dword:0000001E
/opt/jp1ajs2/bin/jajs_config -k "[mmm190\JP1AJS2\SCHEDULER\QUEUE\MANAGER\Job]" "ExecutingJobRecoveryTime"=dword:0000001E


/etc/opt/jp1ajs2/jajs_start.cluster mmm190
/opt/jp1ajs2/bin/jajs_spmd_status -h mmm190

 

--動作確認

vim /mnt/sdc2/job1.sh

#!/bin/bash

date >> /mnt/sdc2/job1.log


vim /root/unitbackup.txt

unit=jg1,,jp1admin,;
{
ty=g;
cm="jg1";
el=jobnet1,n,+0+0;
cl=su;
op=mo;
op=tu;
op=we;
op=th;
op=fr;
cl=sa;
unit=jobnet1,,jp1admin,;
{
ty=n;
cm="jobnet1";
sz=10x8;
el=job11,j,+80+48;
sd=1,2019/11/03;
st=1,23:58;
cy=1,(1,d);
sh=1,ca;
shd=1,2;
ex="mmm194";
unit=job11,,jp1admin,;
{
ty=j;
cm="job11";
sc="/mnt/sdc2/job1.sh";
so="/mnt/sdc2/1";
se="/mnt/sdc2/2";
un="root";
tho=0;
ex="mmm194";
}
}
}

 

export JP1_USERNAME=jp1admin
/opt/jp1ajs2/bin/ajsleave -F AJS3SCHEDULE001 /jg1/jobnet1
/opt/jp1ajs2/bin/ajsdefine -F AJS3SCHEDULE001 -f -d / /root/unitbackup.txt
/opt/jp1ajs2/bin/ajsprint -F AJS3SCHEDULE001 "/*"

ジョブ開始前にエージェントのインタフェースをdownさせる

/opt/jp1ajs2/bin/ajsentry -F AJS3SCHEDULE001 -n /jg1/jobnet1


while true;do
/opt/jp1ajs2/bin/ajsshow -F AJS3SCHEDULE001 -R /jg1/jobnet1
date
sleep 1
done

統合トレースログ確認
ls -ltr /var/opt/hitachi/HNTRLib2/spool
tail -f /var/opt/hitachi/HNTRLib2/spool/hntr23.log

デフォルト設定の場合
→約11分後に異常終了

 

最小値に設定した場合
→約2分後に異常終了

 


--待機系への反映
--マネージャ

共通定義情報の出力
/opt/jp1base/bin/jbsgetcnf -h mmm190 > /root/jbscnf.txt
scp /root/jbscnf.txt mmm192:/root

共通定義情報の取り込み
ssh mmm192 "/opt/jp1base/bin/jbssetcnf /root/jbscnf.txt"