<font size=2 face="sans-serif">I have a 5 node cluster with 112 cores.
I just installed torque 2.4.6. It seems to be working but when I submit
the following.</font>
<br>
<br><font size=2 face="sans-serif">qsub -I -l nodes=32</font>
<br><font size=2 face="sans-serif">qsub: waiting for job 551.eos.inel.gov
to start</font>
<br>
<br><font size=2 face="sans-serif">I try a qrun and I get the following:</font>
<br>
<br><font size=2 face="sans-serif">eos:/opt/torque/sbin # qrun 551</font>
<br><font size=2 face="sans-serif">qrun: Resource temporarily unavailable
MSG=job allocation request exceeds currently available cluster nodes, 32
requested, 5 available 551.eos.inel.gov</font>
<br>
<br><font size=2 face="sans-serif">but it never schedules. I saw in the
documentation that I needed to set the resources_availbale.nodect to a
high number so I did.</font>
<br>
<br><font size=2 face="sans-serif">when I run printserverdb I get:</font>
<br>
<br><font size=2 face="sans-serif">eos:/opt/torque/sbin # printserverdb</font>
<br><font size=2 face="sans-serif">---------------------------------------------------</font>
<br><font size=2 face="sans-serif">numjobs: &nbsp; &nbsp; &nbsp; &nbsp;
&nbsp; &nbsp; &nbsp; &nbsp;0</font>
<br><font size=2 face="sans-serif">numque: &nbsp; &nbsp; &nbsp; &nbsp;
1</font>
<br><font size=2 face="sans-serif">jobidnumber: &nbsp; &nbsp; &nbsp; &nbsp;
&nbsp; &nbsp;552</font>
<br><font size=2 face="sans-serif">sametm: &nbsp; &nbsp; &nbsp; &nbsp;
1267574146</font>
<br><font size=2 face="sans-serif">--attributes--</font>
<br><font size=2 face="sans-serif">total_jobs = 1</font>
<br><font size=2 face="sans-serif">state_count = Transit:0 Queued:1 Held:0
Waiting:0 Running:0 Exiting:0</font>
<br><font size=2 face="sans-serif">default_queue = all</font>
<br><font size=2 face="sans-serif">log_events = 511</font>
<br><font size=2 face="sans-serif">mail_from = adm</font>
<br><font size=2 face="sans-serif">query_other_jobs = True</font>
<br><font size=2 face="sans-serif">resources_available.nodect = 2048</font>
<br><font size=2 face="sans-serif">scheduler_iteration = 600</font>
<br><font size=2 face="sans-serif">node_check_rate = 150</font>
<br><font size=2 face="sans-serif">tcp_timeout = 6</font>
<br><font size=2 face="sans-serif">pbs_version = 2.4.6</font>
<br><font size=2 face="sans-serif">next_job_number = 551</font>
<br><font size=2 face="sans-serif">net_counter = 3 0 0</font>
<br>
<br><font size=2 face="sans-serif">eos:/opt/torque/sbin # qmgr -c &quot;p
s&quot;</font>
<br><font size=2 face="sans-serif">#</font>
<br><font size=2 face="sans-serif"># Create queues and set their attributes.</font>
<br><font size=2 face="sans-serif">#</font>
<br><font size=2 face="sans-serif">#</font>
<br><font size=2 face="sans-serif"># Create and define queue all</font>
<br><font size=2 face="sans-serif">#</font>
<br><font size=2 face="sans-serif">create queue all</font>
<br><font size=2 face="sans-serif">set queue all queue_type = Execution</font>
<br><font size=2 face="sans-serif">set queue all resources_max.walltime
= 672:00:00</font>
<br><font size=2 face="sans-serif">set queue all resources_available.nodect
= 2048</font>
<br><font size=2 face="sans-serif">set queue all enabled = True</font>
<br><font size=2 face="sans-serif">set queue all started = True</font>
<br><font size=2 face="sans-serif">#</font>
<br><font size=2 face="sans-serif"># Set server attributes.</font>
<br><font size=2 face="sans-serif">#</font>
<br><font size=2 face="sans-serif">set server acl_hosts = eos</font>
<br><font size=2 face="sans-serif">set server managers = awm@eos.inel.gov</font>
<br><font size=2 face="sans-serif">set server managers += lucads2@eos.inel.gov</font>
<br><font size=2 face="sans-serif">set server managers += poolrl@eos.inel.gov</font>
<br><font size=2 face="sans-serif">set server managers += sheljk@eos.inel.gov</font>
<br><font size=2 face="sans-serif">set server default_queue = all</font>
<br><font size=2 face="sans-serif">set server log_events = 511</font>
<br><font size=2 face="sans-serif">set server mail_from = adm</font>
<br><font size=2 face="sans-serif">set server query_other_jobs = True</font>
<br><font size=2 face="sans-serif">set server resources_available.nodect
= 2048</font>
<br><font size=2 face="sans-serif">set server scheduler_iteration = 600</font>
<br><font size=2 face="sans-serif">set server node_check_rate = 150</font>
<br><font size=2 face="sans-serif">set server tcp_timeout = 6</font>
<br><font size=2 face="sans-serif">set server next_job_number = 552</font>
<br>
<br><font size=2 face="sans-serif">Any ideas what I need to do to get this
working?</font>
<br>
<br><font size=2 face="sans-serif">Thanks,<br>
<br>
Jon Shelley<br>
HPC Software Consultant<br>
Idaho National Lab<br>
Phone (208) 526-9834<br>
Fax (208) 526-0122<br>
</font>