<div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote">On Tue, Sep 24, 2013 at 9:30 AM, Andrus, Brian Contractor <span dir="ltr">&lt;<a href="mailto:bdandrus@nps.edu" target="_blank">bdandrus@nps.edu</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">





<div link="blue" vlink="purple" lang="EN-US">
<div>
<p>Ok, This one is still going on with the same array job.<u></u><u></u></p>
<p><u></u> <u></u></p>
<p>I have many array jobs (same parent job) that have gone into a &#39;blocked&#39; status because they couldn&#39;t start in a timely manner (DEFERTIME/DEFERCOUNT). Not unsual for a sizeable array job with slot limits (set server max_slot_limit =
 512).<u></u><u></u></p>
<p><u></u> <u></u></p>
<p>So I want to start some of these jobs. The user has NO jobs currently running (there ARE other jobs running, only 5 are other array jobs, but a different user).<u></u><u></u></p>
<p><u></u> <u></u></p>
<p>I am trying with job 20139590[1561]<u></u><u></u></p>
<p>Here is what I try/get:<u></u><u></u></p>
<p><u></u> <u></u></p>
<p><i>[root@cluster ~]# qrls 20139590[1561]<u></u><u></u></i></p>
<p><i>[root@cluster ~]# qrun 20139590[1561]<u></u><u></u></i></p>
<p><i>qrun: Invalid request MSG=Cannot run job. Array slot limit is 512 and there are already 512 jobs running<u></u><u></u></i></p>
<p><i>20139590[1561].cluster<u></u><u></u></i></p>
<p><i>[root@cluster ~]# qrerun 20139590[1561]<u></u><u></u></i></p>
<p><i>qrerun: Request invalid for state of job MSG=job 20139590[1561].cluster is in a bad state 20139590[1561].cluster<u></u><u></u></i></p>
<p><u></u> <u></u></p>
<p><u></u> <u></u></p>
<p>I have tried restarting pbs_server and looked at the output of pbsnodes to see if there are any of this job floating around, but there is not. Also checked on each node for anything for that job/user.. Nothing there as well.<u></u><u></u></p>

<p><u></u> <u></u></p>
<p>Any ideas what is going on here and/or how to get these jobs running?<u></u><u></u></p>
<p><u></u> <u></u></p>
<p><u></u> <u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal"><span style="color:#1f497d">Brian Andrus<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:#1f497d">ITACS/Research Computing<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:#1f497d">Naval Postgraduate School<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:#1f497d">Monterey, California<u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:#1f497d">voice: <a href="tel:831-656-6238" value="+18316566238" target="_blank">831-656-6238</a><u></u><u></u></span></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p><u></u></p></div></div></blockquote><div>Brian,<br><br>I see you are doing a qrls on the job before running the job. So these jobs are on hold before they run. Correct?<br><br></div><div>Regards <br></div><br clear="all">
</div><br>-- <br>Ken Nielson<br>+1 801.717.3700 office +1 801.717.3738 fax<br>1712 S. East Bay Blvd, Suite 300  Provo, UT  84606<br><a href="http://www.adaptivecomputing.com" target="_blank">www.adaptivecomputing.com</a><br>
<br>
</div></div>