<span class="Apple-style-span" style="font-family: arial, sans-serif; font-size: 13px; border-collapse: collapse; ">I&#39;ve a very simple setup, a Beowulf Cluster with 3 nodes; server client1 and client2.<br>mpich user is mounted on client 1 and 2 using NFS and MPICH2 is installed in mpich&#39;s home dir<br>
Torque-2.4.3 is installed on this cluster with following configuration<br>for server<br>./configure --prefix=/opt/pbs --enable-mom --enable-server --enable-client --with-default-server=server<br>and for client<br>./configure --prefix=/opt/pbs --enable-mom --enable-client --with-default-server=server<br>
after installing I&#39;ve installed packeges<br>server mom and client --&gt; server<br>mom and client --&gt; client1 and 2<br>since my server is also a compute node so I&#39;ve installed mom package on server.<br>and my default queue is<br>
qmgr<br>Qmgr: create queue batch<br>Qmgr: set server operators = root@server<br>Qmgr: set queue batch queue_type = Execution<br>Qmgr: set queue batch started = True<br>Qmgr: set queue batch enabled = True<br>Qmgr: set server default_queue = batch<br>
Qmgr: set server scheduling = True<br><br>now the problem is job&#39;s with resource requirements can&#39;t run, if I type a script<br><br>#!/bin/sh<br>#PBS -N testJob<br>#PBS -l nodes=2:ppn=2<br>#PBS -l walltime=00:02:00<br>
sleep 100<br>/home/mpich/mpich2-install/bin/mpirun -n 10 mpich2-1.0.8/examples/cpi<br>hostname<br><br>would not run but but if I ommit the line #PBS -l nodes=2:ppn=2 it would run. Why is it that I can&#39;t submit resource requirements?<br>
and following would run perfectly<br><br>#!/bin/sh<br>#PBS -N testJob<br>#PBS -l walltime=00:02:00<br>sleep 100<br>/home/mpich/mpich2-install/bin/mpirun -n 10 mpich2-1.0.8/examples/cpi<br>hostname<br><br>[mpich@server ~]$ qsub jobScript.sh (I submitted a script with resource requirement)<br>
14.server<br>but there was no output in home dir and<br>following are the log&#39;s generated <br>pbs_mom<br>01/13/2010 15:07:49;0008;   pbs_mom;Job;14.server;JOIN JOB as node 1<br>01/13/2010 15:07:59;0001;   pbs_mom;Svr;pbs_mom;LOG_DEBUG::delete_blcr_checkpoint_files, No checkpoint directory specified for 14.server<br>
pbs_server<br>01/13/2010 15:07:49;0100;PBS_Server;Job;14.server;enqueuing into batch, state 1 hop 1<br>01/13/2010 15:07:49;0008;PBS_Server;Job;14.server;Job Queued at request of mpich@server, owner = mpich@server, job name = testJob, queue = batch<br>
01/13/2010 15:07:49;0040;PBS_Server;Svr;server;Scheduler was sent the command new<br>01/13/2010 15:07:49;0008;PBS_Server;Job;14.server;Job Modified at request of Scheduler@server<br>01/13/2010 15:07:49;0008;PBS_Server;Job;14.server;Job Run at request of Scheduler@server<br>
01/13/2010 15:07:49;0040;PBS_Server;Svr;server;Scheduler was sent the command recyc<br>01/13/2010 15:08:00;0010;PBS_Server;Job;14.server;Exit_status=0 resources_used.cput=00:00:00 resources_used.mem=380kb resources_used.vmem=2428kb resources_us<br>
ed.walltime=00:00:12<br>01/13/2010 15:08:09;000d;PBS_Server;Job;14.server;Post job file processing error; job 14.server on host client1/1+client1/0+server/1+server/0<br>01/13/2010 15:08:09;0100;PBS_Server;Job;14.server;dequeuing from batch, state COMPLETE<br>
01/13/2010 15:08:09;0040;PBS_Server;Svr;server;Scheduler was sent the command term<br>pbs_sched<br>01/13/2010 15:07:49;0040; pbs_sched;Job;14.server;Job Run</span><div><font class="Apple-style-span" face="arial, sans-serif"><span class="Apple-style-span" style="border-collapse: collapse;"><br>
</span></font></div><div><font class="Apple-style-span" face="arial, sans-serif"><span class="Apple-style-span" style="border-collapse: collapse;"><br></span></font></div>