<DIV>
<DIV>Dear all,</DIV>
<DIV>Hello, I did a fresh installation of torque 2.3.0 on my cluster, and I met a strange post job file processing problem. I did the same installation procedure on all the 5 compute nodes (node1, node2, node3, node4, node5) and node0 acts as the master. On the compute nodes, I just installed the packages:</DIV>
<DIV>&nbsp;</DIV>
<DIV>/usr/local/torque-package-mom-linux-i686.sh --install<BR>/usr/local/torque-package-clients-linux-i686.sh --install</DIV>
<DIV>&nbsp;</DIV>
<DIV>and then, on the compute nodes, I ran: pbs_mom</DIV>
<DIV>&nbsp;</DIV>
<DIV>The problem is, when I submit test jobs, <STRONG>only the node1 </STRONG>could send the output file back to the master node. <STRONG>Then other 4 compute nodes could not send the output file back.</STRONG> I ran the command qstat -f and saw following sentences:</DIV>
<DIV>......</DIV>
<DIV>sched_hint:Post job file processing error;job32.ciarlab11.cluster.net on host ciarlab14.cluster.net/0</DIV>
<DIV>Unable to copy file /var/spool/torque/spool/32.ciarlab11.cluster.net.OU to ciarlab11.cluster.net:/usr/local/out</DIV>
<DIV>Unable to copy file /var/spool/torque/spool/32.ciarlab11.cluster.net.ER to ciarlab11.cluster.net:/usr/local/err</DIV>
<DIV>comment=Job started on Thu Mar 12 at 21:09</DIV>
<DIV>etime=Thu Mar 12 21:09:18 2009</DIV>
<DIV>exit_status = -1</DIV>
<DIV>submit_args=pbsjob</DIV>
<DIV>start_time=Thu Mar 12 21:09:18 2007</DIV>
<DIV>start_count=1</DIV>
<DIV>&nbsp;</DIV>
<DIV>And my job scipt is:</DIV>
<DIV>#!/bin/sh</DIV>
<DIV>#PBS -N exampleJob</DIV>
<DIV>#PBS -o /usr/local/out</DIV>
<DIV>#PBS -e /usr/local/err</DIV>
<DIV>#PBS -V</DIV>
<DIV>echo 'helloworld'</DIV>
<DIV>&nbsp;</DIV>
<DIV>I have spent 2 days on this issue, and I hope I can get some support from this mailling list.</DIV>
<DIV>Any help will be appraciated.</DIV>
<DIV>&nbsp;</DIV>
<DIV>Thanks!</DIV>
<DIV>Regards,</DIV>
<DIV>Tracy</DIV><BR><BR></DIV><br><!-- footer --><br><span title="neteasefooter"/><hr/>
<a href="http://www.yeah.net">网易邮箱,中国第一大电子邮件服务商</a>
</span>