<br><br>
<div class="gmail_quote">On Mon, Jul 14, 2008 at 10:01 AM, Jeremy Mann &lt;<a href="mailto:jeremy@biochem.uthscsa.edu">jeremy@biochem.uthscsa.edu</a>&gt; wrote:<br>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">
<div>
<div></div>
<div class="Wj3C7c"><br>Glen Beane wrote:<br>&gt; On Mon, Jul 14, 2008 at 9:35 AM, Jeremy Mann &lt;<a href="mailto:jeremy@biochem.uthscsa.edu">jeremy@biochem.uthscsa.edu</a>&gt;<br>&gt; wrote:<br>&gt;<br>&gt;&gt; I had to reboot our frontend early Sunday morning, and there were about<br>
&gt;&gt; 10,000 jobs in our queue. The frontend recovered from this and has been<br>&gt;&gt; processing the jobs, however, all of our compute nodes will not process<br>&gt;&gt; any jobs. In the mom_logs, I see:<br>&gt;&gt;<br>
&gt;&gt; 07/14/2008 08:35:44;0080; &nbsp; pbs_mom;Req;req_reject;Reject reply<br>&gt;&gt; code=15001(Unknown Job Id), aux=0, type=StatusJob, from<br>&gt;&gt; PBS_Server@bcf.local<br>&gt;&gt;<br>&gt;&gt; According to pbsnodes, the compute nodes are job-exclusive but the jobs<br>
&gt;&gt; never run. How do I recover from this?<br>&gt;<br>&gt;<br>&gt;<br>&gt; can you please include your torque version?<br>&gt;<br>&gt; have you tried rebooting your moms?<br><br></div></div>I fixed it Glen, thanks for the response. The jobs that were assigned to<br>
the compute nodes needed to be deleted, then the moms began to accept new<br>jobs. This is just something I&#39;ll need to keep in mind the next time I<br>have to reboot the frontend node.</blockquote>
<div>&nbsp;</div>
<div>&nbsp;</div>
<div>sounds like a bug to me.&nbsp;&nbsp; What version of TORQUE are you using?</div>
<div>&nbsp;</div></div>