<br><div class="gmail_quote">On Mon, Dec 3, 2012 at 1:09 PM, Ezell, Matthew A. <span dir="ltr">&lt;<a href="mailto:ezellma@ornl.gov" target="_blank">ezellma@ornl.gov</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="HOEnZb"><div class="h5">On 12/2/12 1:24 PM, &quot;Craig Tierney - NOAA Affiliate&quot; &lt;<a href="mailto:craig.tierney@noaa.gov">craig.tierney@noaa.gov</a>&lt;mailto:<a href="mailto:craig.tierney@noaa.gov">craig.tierney@noaa.gov</a>&gt;&gt; wrote:<br>

<br>
Hello all,<br>
<br>
I have a question for Torque users regarding the display of completed jobs in qstat.  Do others find the listing of completed jobs by default via qstat makes finding things in the output much more difficult and completely unnecessary?  Having the completed jobs in qstat can significantly slow down qstat if you have a lot (thousands) of completed jobs which is another hassle.<br>

<br>
I asking this because I need to be able to get error codes from completed jobs (for minutes to hours after completion).  To do this, they have to still be in the queue.  This function is very important, but not to anyone who runs qstat by hand.  Grid Engine had a way to get completed jobs, but only when asked for.<br>

<br>
Thanks,<br>
Craig<br>
<br>
</div></div>Users can run &#39;qstat -r&#39; to get a list of running jobs or &#39;qstat -i&#39; to get a list of queued/held/waiting jobs.<br>
<br></blockquote><div><br></div><div>Matt,</div><div><br></div><div>The above it true.  It would be nice if you could combine these options.</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

My understanding is that once a job has been completed for more than keep_completed seconds, pbs_server forgets about it.  Then, you have to go look in the logs.<br>
<br></blockquote><div><br></div><div>Yes, and I would like to keep the jobs for one day.  That would leave 40-50k jobs in completed state.  A qstat with 20k completed jobs (from a test on a slow server) showed the qstat time went to about 8 seconds.</div>
<div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Alternatively, you could setup an epilogue to capture the exit code and funnel it to some user-accessible location (the job script, flat-file on a shared FS, database, etc).<br>
<br></blockquote><div><br></div><div>I know I can do that, and I can ask Moab for the numbers as well.  However, the Torque server already has the information and can store it.  So why build some </div><div>other mechanism to do this?</div>
<div><br></div><div>Thanks,</div><div>Craig</div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
~Matt<br>
<br>
---<br>
Matt Ezell<br>
HPC Systems Administrator<br>
Oak Ridge National Laboratory<br>
<div class="HOEnZb"><div class="h5">_______________________________________________<br>
torqueusers mailing list<br>
<a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
<a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
</div></div></blockquote></div><br>