<br>Oh well,<br><br>thanks<br><br><div><span class="gmail_quote">On 6/13/06, <b class="gmail_sendername"><a href="mailto:garrick@speculation.org">garrick@speculation.org</a></b> &lt;<a href="mailto:garrick@speculation.org">
garrick@speculation.org</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">On Fri, Jun 09, 2006 at 12:22:34PM +1000, Franc Carter alleged:
<br>&gt; Hi,<br>&gt;<br>&gt; We are using torque-1.2 with a site specific TCL scheduling algorithm. The<br>&gt; number<br>&gt; of jobs in the queue has grown significantly since we implemented (several<br>&gt; thousand)<br>
&gt; and the scheduler takes a long time to make a decision and uses lots of CPU<br>&gt; time.<br>&gt;<br>&gt; Part of the problem appears to be that on every cycle the scheduler needs to<br>&gt; completely reread the entire state instead of being able to find out just
<br>&gt; the<br>&gt; change that caused the scheduler to be invoked - i.e job 1234 exited.<br>&gt;<br>&gt; I had a look through the source code and it looks like this information is<br>&gt; not available in the protocol - but my C is rather rusty.
<br>&gt;<br>&gt; Can someone confirm that this information is not available to the scheduler,<br>&gt; and is<br>&gt; it available in the 2.0 version. More importantly is anyone running a<br>&gt; scheduler that<br>&gt; works 'efficiently' in the 1000's of jobs range.
<br><br>Unfortunately, that is just how it works.&nbsp;&nbsp;Each scheduling iteration<br>must call pbs_statjob() and &quot;download&quot; all job info.<br><br>I've been thinking that it would be nice to have a second version of the
<br>pbs_stat*() functions that save their own state inside of pbs_server and<br>only return changes (as long as the connection is maintained.)<br><br><br>_______________________________________________<br>torqueusers mailing list
<br><a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br><a href="http://www.supercluster.org/mailman/listinfo/torqueusers">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br></blockquote>
</div><br><br clear="all"><br>-- <br>Franc