<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
  <title></title>
</head>
<body bgcolor="#ffffff" text="#3366ff">
<font face="Nimbus Roman No9 L">Dear All,<br>
<br>
Im having problems in finishing the configuration of the Torque Batch
System.<br>
Im using the folowing software packages: <br>
<br>
</font>
<ul>
  <li><font face="Nimbus Roman No9 L">torque-scheduler-2.1.6</font></li>
  <li><font face="Nimbus Roman No9 L">torque-client-2.1.6</font></li>
  <li><font face="Nimbus Roman No9 L">torque-scheduler-2.1.6</font></li>
</ul>
<font face="Nimbus Roman No9 L"><br>
The queues have been created without any problems and the server can
reach by network all the clients. I have checked this last point
submiting a simple shell script echo 'date' for 10 times from the
server and I can see in the client 10 shell session opened for runing
the job.<br>
<br>
Job submission script:<br>
<br>
<font color="#ff0000"># queue selected for that job<br>
#PBS -q long<br>
cat $PBS_NODEFILE<br>
#PBS -o /home5/userxxx/pbs.output<br>
#PBS -l nodes=1<br>
#PBS -I<br>
#PBS -r n<br>
#PBS -l walltime=12:00:00<br>
#PBS -M userxxx<br>
#PBS -N teste<br>
#########################################<br>
#&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; JOB DEFINITION&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; #<br>
#########################################<br>
#!/bin/bash<br>
#!change the working directory (default is home directory)<br>
cd /home5/userxxx/<br>
echo Running on host `hostname` &gt; /home5/userxxx/pbs.output<br>
echo Time is `date` &gt; /home5/userxxx/pbs.output<br>
echo Directory is `pwd` &gt; /home5/userxxx/pbs.output</font><br>
<br>
<br>
<br>
The problem is that I cannot see any output writen to any file.<br>
<br>
Here is the relevant line from the server log:<br>
<br>
<br>
<font color="#ff0000">03/29/2007
16:27:28;000d;PBS_Server;Job;129.pc061.dq.ua.pt.dq.ua.pt;<b>Post job
file processing error</b>; job 129.molecular-modeling.dq.ua.pt on host
planck.dq.ua.pt</font><br>
<br>
<br>
In our cluster all the home directories are globally shared by NFS to
all nodes and I think that scp will no be used in that case but simple
cp command.<br>
In my opinion the problems may be file transactions between the
submission server and the execution (mom) clients.<br>
<br>
I provide the client configuration file from pbs_mom (config):<br>
<br>
<font color="#ff0000"># MOM server configuration file<br>
# if more than one value, separate it by comma.<br>
#<br>
# especifica o servidor de PBS que pode submeter jobs<br>
$pbsserver pc061.dq.ua.pt<br>
# especifica os clientes que o pbs_mom pode contactar atraves de portas
privilegiadas<br>
$pbsclient molecular-modeling.dq.ua.pt<br>
$pbsclient planck.dq.ua.pt</font><br>
<font color="#ff0000">$loglevel 7</font><br>
<br>
<br>
I have also checked the undelivered directory in the client
(planck.dq.ua.pt) and it is empty.<br>
<br>
Can anyone provide me a clue to suceesfully resolve this problem?<br>
Also if I cannot resolve this issue im planing to migrate the Batch
System to Sun Grid Engine. What is your opinion about SGE?<br>
<br>
<br>
Thanks in advance,<br>
<br>
<br>
Best Regard,<br>
<br>
<br>
Nelson Fonseca<br>
</font><font face="Nimbus Roman No9 L"> Beowulf Cluster </font><font
 face="Nimbus Roman No9 L">System Administrator<br>
University of Aveiro<br>
Portugal<br>
<br>
<br>
<br>
<br>
</font>
</body>
</html>