<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="Generator" CONTENT="MS Exchange Server version 6.5.7226.0">
<TITLE>Problem in running Torque job on the slave node</TITLE>
</HEAD>
<BODY>
<!-- Converted from text/plain format -->
<BR>

<P><FONT SIZE=2><BR>
Hi,<BR>
&nbsp;&nbsp;&nbsp; I am facing problem in running simple job. I installed TORQUE on two machines labpc-17.nesc.gla.ac.uk(server) and labpc-18.nesc.gla.ac.uk(slave) by mounting the /home directory of the server(labpc-17.nesc.gla.ac.uk) to the slave(labpc-18.nesc.gla.ac.uk) /home directory as mentioned in the article <A HREF="http://www.linuxgazette.com/node/9480">http://www.linuxgazette.com/node/9480</A>.<BR>
<BR>
But now I am getting another error while submitted&nbsp; simple jobs to torque as shown below :<BR>
[saleemk@labpc-17 saleemk]$ echo &quot; how r u&quot; | qsub<BR>
<BR>
But when I checked the server log file as shown below:<BR>
more /usr/local/spool/pbs/*_logs/*<BR>
I am getting the following error every time I am submitting any job :<BR>
<BR>
<BR>
<BR>
<BR>
08/25/2005 18:24:46;0100;PBS_Server;Job;6.labpc-17.nesc.gla.ac.uk;enqueuing into qsar, state 1 hop 1<BR>
08/25/2005 18:24:46;0008;PBS_Server;Job;6.labpc-17.nesc.gla.ac.uk;Job Queued at request of saleemk@labpc-17.nesc.gla.ac.uk, owner = saleemk@labpc-17.nesc.gla.ac.uk, job name = STDIN, queue = qsar<BR>
08/25/2005 18:24:46;0040;PBS_Server;Svr;labpc-17.nesc.gla.ac.uk;Scheduler sent command new<BR>
08/25/2005 18:24:46;0100;PBS_Server;Req;;Type StatusServer request received from Scheduler@labpc-17.nesc.gla.ac.uk, sock=11<BR>
08/25/2005 18:24:46;0100;PBS_Server;Req;;Type StatusNode request received from Scheduler@labpc-17.nesc.gla.ac.uk, sock=11<BR>
08/25/2005 18:24:46;0100;PBS_Server;Req;;Type StatusQueue request received from Scheduler@labpc-17.nesc.gla.ac.uk, sock=11<BR>
08/25/2005 18:24:46;0100;PBS_Server;Req;;Type SelStat request received from Scheduler@labpc-17.nesc.gla.ac.uk, sock=11<BR>
08/25/2005 18:24:46;0100;PBS_Server;Req;;Type ModifyJob request received from Scheduler@labpc-17.nesc.gla.ac.uk, sock=11<BR>
08/25/2005 18:24:46;0008;PBS_Server;Job;6.labpc-17.nesc.gla.ac.uk;Job Modified at request of Scheduler@labpc-17.nesc.gla.ac.uk08/25/2005 18:24:46;0100;PBS_Server;Req;;Type RunJob request received from Scheduler@labpc-17.nesc.gla.ac.uk, sock=11<BR>
08/25/2005 18:24:46;0008;PBS_Server;Job;6.labpc-17.nesc.gla.ac.uk;Job Run at request of Scheduler@labpc-17.nesc.gla.ac.uk<BR>
08/25/2005 18:24:46;0040;PBS_Server;Svr;labpc-17.nesc.gla.ac.uk;Scheduler sent command recyc<BR>
08/25/2005 18:24:46;0100;PBS_Server;Req;;Type JobObituary request received from pbs_mom@labpc-18.nesc.gla.ac.uk, sock=11<BR>
08/25/2005 18:24:46;0010;PBS_Server;Job;6.labpc-17.nesc.gla.ac.uk;Exit_status=-2 resources_used.cput=00:00:00 resources_used.mem=0kb resources_used.vmem=0kb resources_used.walltime=00:00:00<BR>
08/25/2005 18:24:46;000d;PBS_Server;Job;6.labpc-17.nesc.gla.ac.uk;Post job file processing error; job 6.labpc-17.nesc.gla.ac.uk on host labpc-18.nesc.gla.ac.uk<BR>
08/25/2005 18:24:46;0100;PBS_Server;Job;6.labpc-17.nesc.gla.ac.uk;dequeuing from qsar, state EXITING<BR>
08/25/2005 18:24:46;0040;PBS_Server;Svr;labpc-17.nesc.gla.ac.uk;Scheduler sent command term<BR>
08/25/2005 18:24:46;0100;PBS_Server;Req;;Type StatusServer request received from Scheduler@labpc-17.nesc.gla.ac.uk, sock=9<BR>
08/25/2005 18:24:46;0100;PBS_Server;Req;;Type StatusNode request received from Scheduler@labpc-17.nesc.gla.ac.uk, sock=9<BR>
08/25/2005 18:24:46;0100;PBS_Server;Req;;Type StatusQueue request received from Scheduler@labpc-17.nesc.gla.ac.uk, sock=9<BR>
08/25/2005 18:24:46;0100;PBS_Server;Req;;Type SelStat request received from Scheduler@labpc-17.nesc.gla.ac.uk, sock=9<BR>
08/25/2005 18:24:49;0100;PBS_Server;Req;;Type AuthenticateUser request received from saleemk@labpc-17.nesc.gla.ac.uk, sock=11<BR>
08/25/2005 18:24:49;0100;PBS_Server;Req;;Type StatusJob request received from saleemk@labpc-17.nesc.gla.ac.uk, sock=9<BR>
<BR>
<BR>
<BR>
<BR>
It looks to me that error is on labpc-18.nesc.gla.ac.uk as mentioned in the log file(Post job file processing error; job 6.labpc-17.nesc.gla.ac.uk on host labpc-18.nesc.gla.ac.uk) but I dont know how to fix this error and why this error occur.<BR>
<BR>
<BR>
<BR>
<BR>
I am just wondering whether you came across this problem before or you have any idea how to fix it.<BR>
<BR>
<BR>
Kind Regards<BR>
Kashif Saleem.<BR>
<BR>
<BR>
<BR>
<BR>
<BR>
<BR>
<BR>
</FONT>
</P>

</BODY>
</HTML>