<br><br>
<div class="gmail_quote">On Mon, Jul 14, 2008 at 9:35 AM, Jeremy Mann &lt;<a href="mailto:jeremy@biochem.uthscsa.edu">jeremy@biochem.uthscsa.edu</a>&gt; wrote:<br>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">I had to reboot our frontend early Sunday morning, and there were about<br>10,000 jobs in our queue. The frontend recovered from this and has been<br>
processing the jobs, however, all of our compute nodes will not process<br>any jobs. In the mom_logs, I see:<br><br>07/14/2008 08:35:44;0080; &nbsp; pbs_mom;Req;req_reject;Reject reply<br>code=15001(Unknown Job Id), aux=0, type=StatusJob, from<br>
PBS_Server@bcf.local<br><br>According to pbsnodes, the compute nodes are job-exclusive but the jobs<br>never run. How do I recover from this?</blockquote>
<div>&nbsp;</div>
<div>&nbsp;</div>
<div>can you please include your torque version?</div>
<div>&nbsp;</div>
<div>have you tried rebooting your moms?</div></div>