<br><font size=2 face="Arial">I think the situation Sam has is slightly
different and I can confirm (practically and with a simple test) the problem.
&nbsp;The difference is to wait 2 minutes between the submission of 81384
and 81385.</font>
<br>
<br><font size=2 face="Arial">This stems from something I've griped about
before, in order for a dependency to be recognized correctly by Torque,
the job that is being depended on must currently be in the queue &nbsp;(I
could be off here, I'm not sure what the all of the legal states are, but
I don't believe C is one of them). &nbsp;If the jobid dependency isn't
currently in the queue, the submitted job get's held. &nbsp;I'm not willing
to say what the correct behavior is there, though.</font>
<br>
<br><font size=2 face="Arial">Nate</font>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<table width=100%>
<tr valign=top>
<td width=40%><font size=1 face="sans-serif"><b>&quot;Garrick Staples&quot;
&lt;garrick@clusterresources.com&gt;</b> </font>
<br><font size=1 face="sans-serif">Sent by: torqueusers-bounces@supercluster.org</font>
<p><font size=1 face="sans-serif">05-Sep-2006 17:39</font>
<td width=59%><font size=1 face="sans-serif">&nbsp; &nbsp; &nbsp; &nbsp;
</font>
<table width=100%>
<tr>
<td>
<div align=right><font size=1 face="sans-serif">To</font></div>
<td valign=top><font size=1 face="sans-serif">torqueusers@supercluster.org</font>
<tr>
<td>
<div align=right><font size=1 face="sans-serif">cc</font></div>
<td valign=top>
<tr>
<td>
<div align=right><font size=1 face="sans-serif">Subject</font></div>
<td valign=top><font size=1 face="sans-serif">Re: [torqueusers] dependencies
on completed jobs</font></table>
<br>
<table>
<tr valign=top>
<td>
<td></table>
<br></table>
<br>
<br>
<br><font size=2><tt>On Tue, Sep 05, 2006 at 12:45:27PM -0700, Sam Rash
alleged:<br>
&gt; So we've noticed that if we submit job A, then submit job B which
depends on<br>
&gt; A (-W depend=afterok:B_job_id), and A has already completed (we have<br>
&gt; keep_completed set to at least 30 min), B get stuck in the hold state.
&nbsp;Is<br>
&gt; this intentional? &nbsp;Or a bug?<br>
&gt; <br>
&gt; &nbsp;<br>
&gt; <br>
&gt; It seems like B should surely run.<br>
&gt; <br>
&gt; (maybe A updates its dependents when it completes and B won't check<br>
&gt; explicitly?)<br>
<br>
The simple test works fine for me.<br>
<br>
[garrick@hpcjr-master garrick]$ echo sleep 60 | qsub<br>
81384.hpcjr-master.usc.edu<br>
[garrick@hpcjr-master garrick]$ echo sleep 60 | qsub -W depend=afterok:81384<br>
81385.hpcjr-master.usc.edu<br>
[garrick@hpcjr-master garrick]$ echo sleep 60 | qsub -W depend=afterok:81385<br>
81386.hpcjr-master.usc.edu<br>
<br>
After 1.5 minutes:<br>
81384.hpcjr-master.u garrick &nbsp;batch &nbsp; &nbsp;STDIN &nbsp; &nbsp;
&nbsp; 10643 &nbsp; &nbsp; 1 &nbsp;-- &nbsp; &nbsp;-- 01:00 C 00:00<br>
81385.hpcjr-master.u garrick &nbsp;batch &nbsp; &nbsp;STDIN &nbsp; &nbsp;
&nbsp; 10804 &nbsp; &nbsp; 1 &nbsp;-- &nbsp; &nbsp;-- 01:00 R &nbsp; --<br>
81386.hpcjr-master.u garrick &nbsp;batch &nbsp; &nbsp;STDIN &nbsp; &nbsp;
&nbsp; &nbsp; -- &nbsp; &nbsp; &nbsp;1 &nbsp;-- &nbsp; &nbsp;-- 01:00 H
&nbsp; --<br>
<br>
And after 2.5 minutes:<br>
81384.hpcjr-master.u garrick &nbsp;batch &nbsp; &nbsp;STDIN &nbsp; &nbsp;
&nbsp; 10643 &nbsp; &nbsp; 1 &nbsp;-- &nbsp; &nbsp;-- 01:00 C 00:00<br>
81385.hpcjr-master.u garrick &nbsp;batch &nbsp; &nbsp;STDIN &nbsp; &nbsp;
&nbsp; 10804 &nbsp; &nbsp; 1 &nbsp;-- &nbsp; &nbsp;-- 01:00 C 00:00<br>
81386.hpcjr-master.u garrick &nbsp;batch &nbsp; &nbsp;STDIN &nbsp; &nbsp;
&nbsp; 10910 &nbsp; &nbsp; 1 &nbsp;-- &nbsp; &nbsp;-- 01:00 R &nbsp; --<br>
<br>
<br>
_______________________________________________<br>
torqueusers mailing list<br>
torqueusers@supercluster.org<br>
http://www.supercluster.org/mailman/listinfo/torqueusers<br>
<br>
</tt></font>
<br>