I just realized now that when I submit jobs from the master node, they get filtered to the proper nodes correctly but when I submit them from another submit_host, they are queued and run, but don&#39;t care about the kind of node: <br>


<br><i>41507-04/19/2010 18:16:04;0040;PBS_Server;Req;set_nodes;allocating nodes for job <a href="http://1209.master.node.com">1209.master.node.com</a> with node expression &#39;COREDUO&#39;<br><br>41508-04/19/2010 18:16:04;0008;PBS_Server;Job;1209.</i><i><a href="http://master.node.com">master.node.com</a></i><i>;could not locate requested resources &#39;COREDUO&#39; (node_spec failed) cannot allocate node &#39;06.</i><i><a href="http://node.com">node.com</a></i><i>&#39; to job - node not currently available (nps needed/free: 1/0,  joblist: 1029.</i><i><a href="http://master.node.com">master.node.com</a></i><i>:0,1208.</i><i><a href="http://master.node.com">master.node.com</a></i><i>:1)</i><br>

<br>Obviously, <a href="http://master.node.com">master.node.com</a> is a fake name, but the point is that when I try to launch a job to the <i>short</i> queue, torque realizes that &quot;needsnode&quot; of type COREDUO but there aren&#39;t any available so doesn&#39;t allocate any node and stay waiting.<br>

<br>I would like, as I said on my previous mail, that if every COREDUO nodes are busy, then use the other type of nodes: XEON. But at least I can see the queue is filtering the allocation of nodes depending on the type.<br>

<br>Any idea why this doesn&#39;t work submiting the jobs from the submit_host?????<br><br><br>Thanks a lot again!<br><br><br>Fernando.<br><br><div class="gmail_quote">2010/4/19 Fernando Campos <span dir="ltr">&lt;<a href="mailto:fernando.campos@uam.es" target="_blank">fernando.campos@uam.es</a>&gt;</span><br>

<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hi all!!<br><br>I&#39;m having troubles configuring torque server. The situation is, let&#39;s say, 10 nodes running pbs_mom, 1 master node running pbs_server and pbs_sched (and NFS server and other stuffs), 1 submit host with torque-client installed to launch jobs and check the queues. <br>



<br>The <i>nodes</i> file makes two sets of nodes depending on the type of processor: COREDUO and XEON.<br>I&#39;ve added the bold lines to my queues configuration so, executing <i>$ qmgr -c &quot;p s&quot;</i> on the master node running pbs_server I get:<br>



<br><div style="margin-left: 40px;"><i>#</i><br><i># Create queues and set their attributes.</i><br><i>#</i><br><i>#</i><br><i># Create and define queue long</i><br><i>#</i><br><i>create queue long</i><br><i>set queue long queue_type = Execution</i><br>



<i><b>set queue long resources_default.neednodes = XEON</b></i><br><i>set queue long enabled = True</i><br><i>set queue long started = True</i><br><i>#</i><br><i># Create and define queue short</i><br><i>#</i><br><i>create queue short</i><br>



<i>set queue short queue_type = Execution</i><br><i>set queue short resources_max.cput = 24:00:00</i><br><i>set queue short resources_max.walltime = 25:00:00</i><br><i><b>set queue short resources_default.neednodes = COREDUO</b></i><br>



<i>set queue short enabled = True</i><br><i>set queue short started = True</i><br></div><br clear="all"><br>So it&#39;s supposse that when I submit a job to the <i>short</i> queue should be executed on a COREDUO node, and if I submit a job to the <i>long</i> queue, execute on a XEON node. Obviously it&#39;s not working like that and I realize that when I execute <i>$ qmgr -c &quot;p s&quot;</i> from the submit machine I get different answer: <br>



<br><div style="margin-left: 40px;"><i>#<br># Create queues and set their attributes.<br>#<br>#<br># Create and define queue long<br>#<br>create queue long <br>set queue long queue_type = Execution<br>set queue long enabled = True<br>



set queue long started = True<br>#<br># Create and define queue short<br>#<br>create queue short<br>set queue short queue_type = Execution<br>set queue short resources_max.cput = 24:00:00<br>set queue short resources_max.walltime = 25:00:00<br>



set queue short enabled = True<br>set queue short started = True<br></i></div><br>NO <i><b>set queue &lt;queue&gt; resources_default.neednodes = &lt;NODE_GROUP&gt; </b></i>LINES AT ALL!!!!<br>I&#39;ve already checked and used the submit host to submit jobs to the master node and they are executed on the nodes. I have also checked nodes status with pbsnodes and everything seem work fine but this: they don&#39;t take care about &quot;neednodes&quot;.<br>



<br>Have anybody got any idea about why is this working this way???<br><br>BTW, I also would like to send jobs on the short queue to XEON nodes if all the COREDUO are busy and send jobs on the long queue to COREDUO nodes if all the XEON are busy. Any hint??<br>



<br>Thank you very much.<br><br>Cheers.<br><br>Fernando.<br><font color="#888888"><br></font></blockquote></div><br>-- <br>---------------------------------------------------------------------------------------------------------<br>

Fernando Campos Del Pozo<br>Departamento de Física Teórica<br>
Facultad de Ciencias / Módulo 15 (C-XI) / Despacho 512<br>Universidad Autónoma de Madrid<br>Tlf.: +34-914974893<br>e-mail: <a href="mailto:fernando.campos@uam.es" target="_blank">fernando.campos@uam.es</a><br>