Thanks James!<br><br><div class="gmail_quote">On Mon, Feb 20, 2012 at 11:43 AM, Coyle, James J [ITACD] <span dir="ltr">&lt;<a href="mailto:jjc@iastate.edu">jjc@iastate.edu</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">






<div lang="EN-US" link="blue" vlink="purple">
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">Cristina,<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">  I think that it is common to use two interfaces on the login node, one inward facing on a private subnet and
<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">one outward facing, and place the internal interface name in /var/spool/torque/server_name .<u></u><u></u></span></p>

<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">  Make sure that<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">   What I always do is to use /etc/hosts and insert a line like:<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">172.16.10.1    loginnode  
</span>admin <span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">
  </span>admin.default.domain<span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d"><u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">and copy /etc/host through the compute nodes.<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">  You will also want to make sure that<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">   files
<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">precedes
<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">dns<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">   in /etc/nsswitch.conf<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">   Then I can use the internal name.<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d"><u></u> <u></u></span></p>
<p style="margin-left:20.25pt">
<u></u><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d"><span>-<span style="font:7.0pt &quot;Times New Roman&quot;">         
</span></span></span><u></u><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d">Jim C.<u></u><u></u></span></p>
<p style="margin-left:20.25pt"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1f497d"><u></u> <u></u></span></p>
<div style="border:none;border-left:solid blue 1.5pt;padding:0in 0in 0in 4.0pt">
<div>
<div style="border:none;border-top:solid #b5c4df 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;">From:</span></b><span style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;"> <a href="mailto:torqueusers-bounces@supercluster.org" target="_blank">torqueusers-bounces@supercluster.org</a> [mailto:<a href="mailto:torqueusers-bounces@supercluster.org" target="_blank">torqueusers-bounces@supercluster.org</a>]
<b>On Behalf Of </b>Christina Salls<br>
<b>Sent:</b> Friday, February 17, 2012 3:08 PM<br>
<b>To:</b> Torque Users Mailing List; Michael Saxon; Frank Indiviglio; Craig Tierney; help &gt;&gt; GLERL IT Help; Jeff Hanson; Brian Beagan; John Cardenas<br>
<b>Subject:</b> [torqueusers] Scheduler bound to ETHO IP port<u></u><u></u></span></p>
</div>
</div><div><div class="h5">
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal">Hi all,<u></u><u></u></p>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">       I have been experiencing a problem with jobs staying in my default queue until I force execution with a qrun.  It turns out that the reason is that my torque server is configured on my second ethernet interface which is connected
 to my compute nodes.  The problem is that the scheduler is bound to the 1st interface port.  <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<div>
<p class="MsoNormal">[root@wings server_logs]# ps -ef | grep pbs<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">root      1268     1  0 13:56 ?        00:00:00 /usr/local/sbin/pbs_server -d /var/spool/torque -H admin.default.domain<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">root     14768     1  0 14:25 ?        00:00:00 /usr/local/sbin/pbs_sched -d /var/spool/torque<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">root     21956 16623  0 14:41 pts/25   00:00:00 grep pbs<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">[root@wings server_logs]# lsof -p 14768<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">COMMAND     PID USER   FD   TYPE    DEVICE SIZE/OFF    NODE NAME<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  cwd    DIR      8,98     4096 6032970 /var/spool/torque/sched_priv<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  rtd    DIR      8,98     4096       2 /<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  txt    REG      8,98   268782 3421344 /usr/local/sbin/pbs_sched<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  mem    REG      8,98   156872 3276802 /lib64/<a href="http://ld-2.12.so" target="_blank">ld-2.12.so</a><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  mem    REG      8,98  1979000 3276803 /lib64/<a href="http://libc-2.12.so" target="_blank">libc-2.12.so</a><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  mem    REG      8,98    65928 3277205 /lib64/<a href="http://libnss_files-2.12.so" target="_blank">libnss_files-2.12.so</a><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  mem    REG      8,98   791107 3418524 /usr/local/lib/libtorque.so.2.0.0<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    0r   CHR       1,3      0t0    3772 /dev/null<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    1w   REG      8,98        0 6033331 /var/spool/torque/sched_priv/sched_out<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    2w   REG      8,98        0 6033331 /var/spool/torque/sched_priv/sched_out<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    3w   REG      8,98     2699 6033359 /var/spool/torque/sched_logs/20120217<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    4u  IPv4 801882953      0t0     TCP <a href="http://wings.glerl.noaa.gov:15004" target="_blank">
wings.glerl.noaa.gov:15004</a> (LISTEN)<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    5wW  REG      8,98        7 6033329 /var/spool/torque/sched_priv/sched.lock<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    6r   REG      8,98     4374 6032952 /var/spool/torque/sched_priv/resource_group<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    7w   REG      8,98        0 6033360 /var/spool/torque/sched_priv/accounting/20120217<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">[root@wings server_logs]# cd ..<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">[root@wings torque]# ls<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">aux  checkpoint  job_logs  mom_logs  mom_priv  pbs_environment  sched_logs  sched_priv  server_logs  server_name  server_priv  spool  undelivered<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">[root@wings torque]# lsof -n -p 14768<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">COMMAND     PID USER   FD   TYPE    DEVICE SIZE/OFF    NODE NAME<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  cwd    DIR      8,98     4096 6032970 /var/spool/torque/sched_priv<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  rtd    DIR      8,98     4096       2 /<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  txt    REG      8,98   268782 3421344 /usr/local/sbin/pbs_sched<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  mem    REG      8,98   156872 3276802 /lib64/<a href="http://ld-2.12.so" target="_blank">ld-2.12.so</a><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  mem    REG      8,98  1979000 3276803 /lib64/<a href="http://libc-2.12.so" target="_blank">libc-2.12.so</a><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  mem    REG      8,98    65928 3277205 /lib64/<a href="http://libnss_files-2.12.so" target="_blank">libnss_files-2.12.so</a><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root  mem    REG      8,98   791107 3418524 /usr/local/lib/libtorque.so.2.0.0<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    0r   CHR       1,3      0t0    3772 /dev/null<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    1w   REG      8,98        0 6033331 /var/spool/torque/sched_priv/sched_out<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    2w   REG      8,98        0 6033331 /var/spool/torque/sched_priv/sched_out<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    3w   REG      8,98     2699 6033359 /var/spool/torque/sched_logs/20120217<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    4u  IPv4 801882953      0t0     TCP <a href="http://192.94.173.9:15004" target="_blank">
192.94.173.9:15004</a> (LISTEN)<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    5wW  REG      8,98        7 6033329 /var/spool/torque/sched_priv/sched.lock<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    6r   REG      8,98     4374 6032952 /var/spool/torque/sched_priv/resource_group<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">pbs_sched 14768 root    7w   REG      8,98        0 6033360 /var/spool/torque/sched_priv/accounting/20120217<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">[root@wings torque]# ls<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">aux  checkpoint  job_logs  mom_logs  mom_priv  pbs_environment  sched_logs  sched_priv  server_logs  server_name  server_priv  spool  undelivered<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">[root@wings torque]# cd sched_priv<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">[root@wings sched_priv]# ls<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">accounting  dedicated_time  holidays  resource_group  sched_config  sched.lock  sched_out<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">[root@wings sched_priv]# more sched_config<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">When I used hostname to change the name to the admin.default.domain, and restarted the pbs_sched daemon, everything started working.  <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Any idea how to change the hostname/IP/interface that the scheduler uses?<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Thanks,<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">     Christina<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<p class="MsoNormal">-- <br>
Christina A. Salls<u></u><u></u></p>
<div>
<p class="MsoNormal">GLERL Computer Group<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><a href="mailto:help.glerl@noaa.gov" target="_blank">help.glerl@noaa.gov</a><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Help Desk x2127<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><a href="mailto:Christina.Salls@noaa.gov" target="_blank">Christina.Salls@noaa.gov</a><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Voice Mail <a href="tel:734-741-2446" value="+17347412446" target="_blank">734-741-2446</a> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
</div></div></div>
</div>
</div>

<br>_______________________________________________<br>
torqueusers mailing list<br>
<a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
<a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>Christina A. Salls<div>GLERL Computer Group</div><div><a href="mailto:help.glerl@noaa.gov" target="_blank">help.glerl@noaa.gov</a></div><div>Help Desk x2127</div>
<div><a href="mailto:Christina.Salls@noaa.gov" target="_blank">Christina.Salls@noaa.gov</a></div><div>Voice Mail 734-741-2446 </div><div><br></div><br>