Dear all,<br>

<br>

I am trying torque-2.0.0p8 on RHEL 4 WS x86_64.<br>

There are 2 host in my testing environment.<br>

Host A is nfs server + yp server + torque server + torque scheduler.<br>

Host B is nfs client + yp client + torque client.<br>

In host B, can read/write the nfs server file system and yp user can login to host B.<br>

I login to torque server and submit job, the job exit_status is -1.<br>

There are some error messages in host B's mom_log as following:<br>

03/24/2006 14:41:21;0100;&nbsp;&nbsp; pbs_mom;Req;;Type QueueJob request received from <a href="mailto:PBS_Server@i160.ascc" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">PBS_Server@i160.ascc</a>, sock=11<br>


03/24/2006 14:41:21;0100;&nbsp;&nbsp; pbs_mom;Req;;Type JobScript request received from <a href="mailto:PBS_Server@i160.ascc" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">PBS_Server@i160.ascc</a>, sock=11
<br>

03/24/2006 14:41:21;0100;&nbsp;&nbsp; pbs_mom;Req;;Type ReadyToCommit request received from <a href="mailto:PBS_Server@i160.ascc" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">PBS_Server@i160.ascc</a>, sock=11
<br>

03/24/2006 14:41:21;0100;&nbsp;&nbsp; pbs_mom;Req;;Type Commit request received from <a href="mailto:PBS_Server@i160.ascc" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">PBS_Server@i160.ascc</a>, sock=11<br>


03/24/2006 14:41:21;0001;&nbsp;&nbsp; pbs_mom;Svr;pbs_mom;start_exec, job 10.i160.ascc check_pwd failed<br>

03/24/2006 14:41:21;0008;&nbsp;&nbsp; pbs_mom;Req;send_sisters;sending ABORT to sisters<br>
03/24/2006 14:41:21;0100;&nbsp;&nbsp; pbs_mom;Req;;Type StatusJob request received from <a href="mailto:PBS_Server@i160.ascc" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">PBS_Server@i160.ascc</a>, sock=13
<br>
03/24/2006 14:41:21;0100;&nbsp;&nbsp; pbs_mom;Req;;Type CopyFiles request received from <a href="mailto:PBS_Server@i160.ascc" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">PBS_Server@i160.ascc</a>, sock=11
<br>
03/24/2006 14:41:21;0001;&nbsp;&nbsp; pbs_mom;Svr;pbs_mom;Success (0) in fork_to_user, cannot find user 'wzlu' in password file<br>
03/24/2006 14:41:21;0080;&nbsp;&nbsp; pbs_mom;Req;req_reject;Reject
reply code=15023(Bad UID for job execution REJHOST=i159.ascc MSG=cannot
find user 'wzlu' in password file), aux=0, type=CopyFiles, from
<a href="mailto:PBS_Server@i160.ascc" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">PBS_Server@i160.ascc</a><br>
03/24/2006 14:41:21;0001;&nbsp;&nbsp; pbs_mom;Svr;pbs_mom;Inappropriate
ioctl for device (25) in req_cpyfile, fork_to_user failed with
rc=-15023 'cannot find user 'wzlu' in password file' - returning failure<br>
03/24/2006 14:41:21;0100;&nbsp;&nbsp; pbs_mom;Req;;Type DeleteJob request received from <a href="mailto:PBS_Server@i160.ascc" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">PBS_Server@i160.ascc</a>, sock=11
<br>
<br>
pbs_mom can not find user. Have any idea?<br>
Thanks a lot.