Torque was really easy to install, but it seems like my /etc/hosts file must be screwed up, as I can't get the cluster nodes to respond.  Specifically, within a cluster of 3 machines, each having an /etc/hosts file of:
<br><br>&nbsp;&nbsp;&nbsp; <a href="http://127.0.0.1">127.0.0.1</a>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; localhost.localdomain&nbsp;&nbsp; localhost<br>&nbsp;&nbsp;&nbsp; <a href="http://199.17.152.17">199.17.152.17</a>&nbsp;&nbsp; runner<br>&nbsp;&nbsp;&nbsp; <a href="http://199.17.152.135">199.17.152.135</a>&nbsp; muscovey
<br>&nbsp;&nbsp;&nbsp; <a href="http://199.17.152.13">199.17.152.13</a>&nbsp;&nbsp; pekin<br>&nbsp;&nbsp;&nbsp; (( other workstations follow ))<br><br>Now, when I have the pbs_server running on runner, and the pbs_mom daemons running on muscovey, pekin, and runner, I et the following status message,
<br><br>&nbsp;&nbsp;&nbsp; [root@runner torque-2.1.6]# pbsnodes -a<br>&nbsp;&nbsp;&nbsp; pekin<br>&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp; state = down<br>&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp; np = 1<br>&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp; ntype = cluster<br><br>&nbsp;&nbsp;&nbsp; muscovey<br>&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp; state = down<br>&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp; np = 1<br>&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp; ntype = cluster
<br><br>&nbsp;&nbsp;&nbsp; runner<br>&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp; state = down&nbsp;&nbsp;&nbsp; <br>&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp; np = 1<br>&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp; ntype = cluster<br><br>I realize this is a pretty low-level question, but what the heck is wrong with my /etc/hosts file?<br><br>regards,<br><br>
NT<br><br><br>ps,&nbsp; the trouble shooting message given by torque is,<br><br>&nbsp;&nbsp;&nbsp; [root@runner torque-2.1.6]# momctl -d 3<br><br>&nbsp;&nbsp;&nbsp; Host: runner/runner&nbsp;&nbsp; Version: 2.1.6<br>&nbsp;&nbsp;&nbsp; WARNING:&nbsp; server not specified (set $pbsserver)
<br>&nbsp;&nbsp;&nbsp; PID:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 30531<br>&nbsp;&nbsp;&nbsp; HomeDirectory:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /var/spool/torque/mom_priv<br>&nbsp;&nbsp;&nbsp; MOM active:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2518 seconds<br>&nbsp;&nbsp;&nbsp; Server Update Interval: 45 seconds<br>&nbsp;&nbsp;&nbsp; LOGLEVEL:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0 (use SIGUSR1/SIGUSR2 to adjust)
<br>&nbsp;&nbsp;&nbsp; Communication Model:&nbsp;&nbsp;&nbsp; RPP<br>&nbsp;&nbsp;&nbsp; TCP Timeout:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 20 seconds<br>&nbsp;&nbsp;&nbsp; NOTE:&nbsp; no prolog configured<br>&nbsp;&nbsp;&nbsp; Alarm Time:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0 of 10 seconds<br>&nbsp;&nbsp;&nbsp; Trusted Client List:&nbsp;&nbsp;&nbsp; <a href="http://199.17.152.17">
199.17.152.17</a>,<a href="http://127.0.0.1">127.0.0.1</a><br>&nbsp;&nbsp;&nbsp; Configured to use /usr/bin/scp -rpB<br>&nbsp;&nbsp;&nbsp; NOTE:&nbsp; no local jobs detected<br><br>&nbsp;&nbsp;&nbsp; diagnostics complete<br><br clear="all"><br>- - - - - - -&nbsp;&nbsp; - - - - - - -&nbsp;&nbsp; - - - - - - - 
<br>Nathan Moore<br>Assistant Professor, Physics<br>Winona State University<br>AIM: nmoorewsu <br>- - - - - - -&nbsp;&nbsp; - - - - - - -&nbsp;&nbsp; - - - - - - -