<HTML><BODY style="word-wrap: break-word; -khtml-nbsp-mode: space; -khtml-line-break: after-white-space; "><DIV>Thanks Paul,</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>No other processes are running for the user. Anyway, we removed this limitation from the queue and the problem persists.</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>Tracing a job with tracejob we see that exec_host is not correctly set:</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>megacelula:/megadisk/people/regina# tracejob 2199</DIV><DIV>/var/spool/torque/mom_logs/20070727: No matching job records located</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>Job: 2199.megacelula</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>07/27/2007 10:45:14  S    enqueuing into batch, state 1 hop 1</DIV><DIV>07/27/2007 10:45:14  S    Job Queued at request of dfsvhs9@megacelula, owner = dfsvhs9@megacelula, job name = TEST, queue = batch</DIV><DIV>07/27/2007 10:45:14  S    Job Modified at request of Scheduler@megacelula</DIV><DIV>07/27/2007 10:45:14  S    Job Run at request of Scheduler@megacelula</DIV><DIV>07/27/2007 10:45:14  A    queue=batch</DIV><DIV>07/27/2007 10:45:15  L    Job Run</DIV><DIV>07/27/2007 10:45:15  A    user=dfsvhs9 group=models jobname=TEST queue=batch ctime=1185525914 qtime=1185525914 etime=1185525914 start=1185525915 exec_host=cell14/1+cell14/0</DIV><DIV>                          Resource_List.neednodes=10:ppn=2 Resource_List.nodect=10 Resource_List.nodes=10:ppn=2 Resource_List.walltime=00:20:30 </DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>Who sets "exec_host" pbs_server or pbs_sched? and how can we track the error?</DIV><DIV><BR class="khtml-block-placeholder"></DIV><BR><DIV> <SPAN class="Apple-style-span" style="border-collapse: separate; border-spacing: 0px 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; text-align: auto; -khtml-text-decorations-in-effect: none; text-indent: 0px; -apple-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><SPAN class="Apple-style-span" style="border-collapse: separate; border-spacing: 0px 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; text-align: auto; -khtml-text-decorations-in-effect: none; text-indent: 0px; -apple-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><DIV>Regina Guilabert Canals</DIV><DIV>Grup de Meteorologia</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>Edif. Mateu Orfila<SPAN class="Apple-tab-span" style="white-space:pre"><SPAN class="Apple-style-span" style="white-space: pre; "><SPAN class="Apple-style-span" style="white-space: pre; ">                                        </SPAN></SPAN></SPAN>Tel: +34 971 17 3213</DIV><DIV>Universitat de les Illes Balears<SPAN class="Apple-tab-span" style="white-space:pre"><SPAN class="Apple-style-span" style="white-space: pre; "><SPAN class="Apple-style-span" style="white-space: pre; ">                </SPAN></SPAN></SPAN>Fax: +34 971 17 3426</DIV><DIV>07122 Palma de Mallorca (Spain) <SPAN class="Apple-tab-span" style="white-space:pre"><SPAN class="Apple-style-span" style="white-space: pre; "><SPAN class="Apple-style-span" style="white-space: pre; ">        </SPAN></SPAN></SPAN>email: <A href="mailto:regina.guilabert@uib.es">regina.guilabert@uib.es</A></DIV><DIV><BR class="khtml-block-placeholder"></DIV><BR class="Apple-interchange-newline"></SPAN></SPAN> </DIV><BR><DIV><DIV>El 26/07/2007, a las 16:53, Paul Gray escribió:</DIV><BR class="Apple-interchange-newline"><BLOCKQUOTE type="cite"><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">-----BEGIN PGP SIGNED MESSAGE-----</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">Hash: SHA1</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; min-height: 14px; "><BR></DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">On Thu, Jul 26, 2007 at 12:16:49PM +0200, Regina Guilabert Canals wrote:</DIV> <BLOCKQUOTE type="cite"><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">Dear TORQUE users,</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; min-height: 14px; "><BR></DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">Without any apparent reason PBS stop allocating the correct number of <SPAN class="Apple-converted-space"> </SPAN></DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">nodes yesterday. Now, when we request, for instance, 4 nodes, the job <SPAN class="Apple-converted-space"> </SPAN></DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">only gets 1 node assigned.</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; min-height: 14px; "><BR></DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">Let me illustrate it with an example:</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; min-height: 14px; "><BR></DIV> </BLOCKQUOTE><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; min-height: 14px; "><BR></DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">I had the same issue, and the cause was the queue limit on max user processes.</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">Your "batch" queue has a limit of 5 processes, was another process running?</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; min-height: 14px; "><BR></DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">- --<SPAN class="Apple-converted-space"> </SPAN></DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">Paul Gray <SPAN class="Apple-converted-space">                                        </SPAN>-o)</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">314 East Gym, Dept. of Computer Science <SPAN class="Apple-converted-space">          </SPAN>/\\</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">University of Northern Iowa<SPAN class="Apple-converted-space">                      </SPAN>_\_V</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">Message void if penguin violated ...<SPAN class="Apple-converted-space">  </SPAN>Don't mess with the penguin</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">No one says, "Hey, I can't read that ASCII attachment ya sent me."</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">-----BEGIN PGP SIGNATURE-----</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">Version: GnuPG v1.4.6 (GNU/Linux)</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; min-height: 14px; "><BR></DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">iD8DBQFGqLVyOH45TZW7mh4RAqWSAKCogdqzimdCtO7qzP08XJIVBvPRDgCeNUH0</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">CXOFY1nS0glk2Y+iSn6Vzx4=</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">=DE+1</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">-----END PGP SIGNATURE-----</DIV> </BLOCKQUOTE></DIV><BR></BODY></HTML>