<br><br><div class="gmail_quote">On Tue, Mar 26, 2013 at 11:33 AM, Glen Beane <span dir="ltr">&lt;<a href="mailto:glen.beane@gmail.com" target="_blank">glen.beane@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="im">On Tue, Mar 26, 2013 at 12:41 PM, David Beer<br>
&lt;<a href="mailto:dbeer@adaptivecomputing.com">dbeer@adaptivecomputing.com</a>&gt; wrote:<br>
&gt; All,<br>
&gt;<br>
&gt; Our QA tests have exposed that when a job file is loaded saying that it&#39;s<br>
&gt; state is running but there is no exec host list defined we don&#39;t handle this<br>
&gt; state, that is, we attempt to perform actions on the job that assume it is<br>
&gt; running, but we can&#39;t talk to the mom because we don&#39;t know what mom it is.<br>
&gt; I can think of two different behaviors:<br>
&gt;<br>
&gt; 1. delete the job<br>
&gt; 2. requeue the job<br>
&gt;<br>
&gt; Which one would you all prefer?<br>
<br>
<br>
</div>how does a job get into this state in the first place?<br></blockquote><div><br></div><div>At this point it appears to be a corrupted job file. More than that we don&#39;t know, but we need to handle this.</div><div>
<br></div><div>David</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
_______________________________________________<br>
torqueusers mailing list<br>
<a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
<a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br><div>David Beer | Senior Software Engineer</div><div>Adaptive Computing</div>