<div dir="ltr">We are setting up Torque 4.1.4 + Moab 7.2.1 in HA mode, job
    submission and dispatching is fine so far.<br><div class="gmail_quote"><div bgcolor="#FFFFFF" text="#000000">
    <br>
    However, we found that when stopping passive pbs_server with
    &quot;/etc/init.d/pbs_server stop&quot;,<br>
    it will stop the active pbs_server instead. Let me show how to make
    this:<br>
    <br>
    master1# ps -ef |grep pbs<br>
    root      67328      1  1 15:54 ?        00:00:16
    /usr/sbin/pbs_server -d /var/spool/torque --ha -l master1:42559 -l
    master2:42559<br>
     <br>
    master2# ps -ef |grep pbs<br>
    root      24491      1  0 16:05 ?        00:00:00
    /usr/sbin/pbs_server -d /var/spool/torque --ha -l master1:42559 -l
    master2:42559<br>
    <br>
    Now the active pbs_server is running on master1:<br>
    master1# qstat -a | head -2<br>
    <br>
    master1:<br>
    <br>
    Now I stop pbs_server on master2 (switching off master2 machine gets
    the same result):<br>
    <br>
    master2# /etc/init.d/pbs_server stop<br>
    <br>
    On master1, pbs_server is shutdown (Shutdown request is from
    mater2):<br>
    <br>
    master1# tail -f /var/spool/torque/server_logs/<a href="tel:20130422" value="+85220130422" target="_blank">20130422</a><br>
    04/22/2013 16:14:57;0086;PBS_Server.73628;Svr;PBS_Server;Shutdown
    request from root@master2<br>
    04/22/2013 16:14:57;0086;PBS_Server.73628;Svr;PBS_Server;Starting to
    shutdown the server, type is Quick<br>
    04/22/2013 16:14:57;0002;PBS_Server.67328;Svr;PBS_Server;Server
    shutdown completed<br>
    04/22/2013 16:14:57;0002;PBS_Server.67328;Svr;Log;Log closed<br>
    <br>
    I found the shutdown behavior is triggered by qterm in
    /etc/init.d/pbs_server stop() function.<br>
    <br>
    stop() {<br>
        status pbs_server &gt;/dev/null 2&gt;&amp;1<br>
        if [ $? -ne 0 ]; then<br>
            echo &quot;pbs_server is not running.&quot;<br>
            exit 0<br>
        fi<br>
        echo -n &quot;Shutting down TORQUE Server: &quot;<br>
        <b>$BIN_PATH/qterm</b><br>
        RET=$?<br>
        if [[ $RET -ne 0 ]]; then<br>
          killproc pbs_server -TERM<br>
          RET=$?<br>
        fi<br>
    <br>
        rm -f /var/lock/subsys/pbs_server<br>
        echo<br>
    }<br>
    <br>
    I saw there is no &quot;qterm&quot; in Torque earlier version. Why does qterm
    kill neighbor&#39;s pbs_server, not itself?<br>
    Is this pbs_server init script not suitable for HA setup?<br>
    <br>
    Thanks.<br>
  </div>

</div><br><br clear="all"><br>-- <br>Clotho Tsang<br>Senior Software Engineer<br>Cluster Technology Limited<br>Email: <a href="mailto:clotho@clustertech.com" target="_blank">clotho@clustertech.com</a><br>Tel: (852) 2655-6129<br>

Fax: (852) 2994-2101<br>Website: <a href="http://www.clustertech.com" target="_blank">www.clustertech.com</a><br>
</div>