There is a monitor process that checks for running jobs that runned more than the walltime in unreachable nodes. The nodes are diskless and loses job info on reboot (or crash :-) ). <br><br>07/15/2009 01:50:23;0008;PBS_Server;Job;<div id=":1bn" class="ii gt">

2915531.servidor.pcarga.local;purging job without checking MOM</div>.<br>OK, I&#39;ll try it with the new version.<br><br>Thanks,<br><br clear="all">---<br>     Luiz Angelo Daros de Luca, Me.<br>            <a href="mailto:luizluca@gmail.com">luizluca@gmail.com</a><br>


<br><br><div class="gmail_quote">2009/7/16 Garrick Staples <span dir="ltr">&lt;<a href="mailto:garrick@usc.edu">garrick@usc.edu</a>&gt;</span><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

On Wed, Jul 15, 2009 at 12:14:46PM -0300, Luiz Angelo Daros de Luca alleged:<br>
<div class="im">&gt; 01:50:23;0008;PBS_Server;Job;2915531.servidor.pcarga.local;purging job<br>
&gt; without checking MOM<br>
<br>
</div>Who or what is doing a qdel -p?  That is breaking things.<br>
<br>
You can certainly upgrade to the latest 2.1.x.  It is quite stable.<br>
<font color="#888888"><br>
--<br>
Garrick Staples, GNU/Linux HPCC SysAdmin<br>
University of Southern California<br>
<br>
The pro-disease movement: <a href="http://www.jennymccarthybodycount.com/" target="_blank">http://www.jennymccarthybodycount.com/</a><br>
<br>
</font><br>_______________________________________________<br>
torquedev mailing list<br>
<a href="mailto:torquedev@supercluster.org">torquedev@supercluster.org</a><br>
<a href="http://www.supercluster.org/mailman/listinfo/torquedev" target="_blank">http://www.supercluster.org/mailman/listinfo/torquedev</a><br>
<br></blockquote></div><br>