<div dir="ltr">On Wed, Jul 16, 2008 at 2:58 AM, Chris Samuel <span dir="ltr">&lt;<a href="mailto:csamuel@vpac.org">csamuel@vpac.org</a>&gt;</span> wrote:<br><div class="gmail_quote"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="Ih2E3d"><br>
----- &quot;Glen Beane&quot; &lt;<a href="mailto:glen.beane@gmail.com">glen.beane@gmail.com</a>&gt; wrote:<br>
<br>
&gt; I&#39;ve been working on some changes in trunk that transfer<br>
&gt; the .OU and .ER spool files from pbs_mom back to pbs_server.<br>
</div>[...]<br>
<div class="Ih2E3d">&gt; Are there any objections to this change in trunk?<br>
<br>
</div>I&#39;m happy as long as there&#39;s a way to ensure that<br>
this never happens on a particular cluster (maybe<br>
by a server configuration setting or by being a<br>
configure option).<br>
<br>
Actually, I&#39;m presuming this is predicated on the<br>
blcr configure option being enabled ? &nbsp; That might<br>
be enough for us.</blockquote></div><br>it only happens if the job has the checkpoint_file attribute set to the name of a checkpoint_file,&nbsp; so if you aren&#39;t going to use blcr checkpoint/restart then you don&#39;t need to worry.&nbsp; We still could put in either a qmgr setting or a compile time setting to turn of this feature (so .OU and .ER files won&#39;t be kept for complete jobs even if the job still has the potential to be restarted)<br>
<br><br>and&nbsp; an update:&nbsp; I&#39;m about to check in the rest of the code to do this (most of the code has already been checked in).&nbsp; It does make the assumption that if pbs_server and the pbs_mom involved are on the same host then they will share a spool directory.&nbsp; I&#39;ve noticed quite a few places where that assumption is made, so in order for me to get everything working with separate spool directories for mom and server on the same host it would actually be a lot more work than it was to get everything working with sharing the same spool directory... so for now if you use blcr and you have a mom and server running on the same host then you need to have them sharing a spool directory in order for the .OU and .ER return to work properly on that host<br>
<br><br></div>