Please follow the steps<div><span class="Apple-style-span" style="font-family: arial, sans-serif; font-size: 13px; border-collapse: collapse; "><br>1. Generate private and public keys of each node......USE &quot;<span style="color: rgb(51, 102, 255); ">ssh-keygen</span>&quot; command <br>

                                                                              <span style="color: rgb(255, 102, 102); ">Node:</span> Generate keys on the user from where u are submitting/executing the job....<span style="color: rgb(51, 102, 255); ">NOT ON THE root USER</span><br>

2. copy public key of <a href="http://node02.cs.grd.in/" target="_blank" style="color: rgb(20, 125, 186); ">node02.cs.grd.in</a>(pbs_server hostname) to <a href="http://node11.cs.grd.in/" target="_blank" style="color: rgb(20, 125, 186); ">node11.cs.grd.in</a>(pbs_mom hostname) and vice versa...........USE &quot;<span style="color: rgb(51, 102, 255); ">ssh-copy-id  hostname</span>&quot; command<br>

3. Now check ssh from <a href="http://node02.cs.grd.in/" target="_blank" style="color: rgb(20, 125, 186); ">node02.cs.grd.in</a> to node11.cs.grd.in.....it should login in <a href="http://node11.cs.grd.in/" target="_blank" style="color: rgb(20, 125, 186); ">node11.cs.grd.in</a> without password. Check same from <a href="http://node11.cs.grd.in/" target="_blank" style="color: rgb(20, 125, 186); ">node11.cs.grd.in</a><br>

</span><br><div class="gmail_quote">On Thu, Jul 8, 2010 at 6:35 PM, Andreas Davour <span dir="ltr">&lt;<a href="mailto:davour@pdc.kth.se">davour@pdc.kth.se</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

<br>
I have been trying to get our kerberized torque to accept jobs. So far with<br>
mixed success.<br>
<br>
When submitting a job it ends up in a queue, but even though maui schedules<br>
it, it never starts.<br>
<br>
Looking in /var/spool/torque I find nothing looking like ER or OU files or any<br>
uncopied files in the undelivered directory.<br>
<br>
On the only node inline the mom log say:<br>
07/08/2010 14:52:09;0001;   pbs_mom;Job;TMomFinalizeJob3;start failed,<br>
improper sid<br>
07/08/2010 14:52:09;0008;   pbs_mom;Req;send_sisters;sending ABORT to sisters<br>
for job <a href="http://15.scheduler-torque-l.pdc.kth.se" target="_blank">15.scheduler-torque-l.pdc.kth.se</a><br>
07/08/2010 14:52:09;0080;   pbs_mom;Svr;preobit_reply;top of preobit_reply<br>
07/08/2010 14:52:09;0080;<br>
pbs_mom;Svr;preobit_reply;DIS_reply_read/decode_DIS_replySvr worked, top of<br>
while loop<br>
07/08/2010 14:52:09;0080;   pbs_mom;Svr;preobit_reply;in while loop, no error<br>
from job stat<br>
07/08/2010 14:52:09;0080;   pbs_mom;Job;<a href="http://15.scheduler-torque-l.pdc.kth.se" target="_blank">15.scheduler-torque-l.pdc.kth.se</a>;obit<br>
sent to server<br>
<br>
I have not set up any ssh keys, since I figured that using kerberos to login<br>
and submit a job, log in access from the scheduler node to the work node<br>
should have been taken care of. I tried to rcp a file and it worked ok.<br>
<br>
Any hints on where to look?<br>
<br>
--<br>
Systems Engineer<br>
PDC Center for High Performance Computing<br>
CSC School of Computer Science and Communication<br>
KTH Royal Institute of Technology<br>
SE-100 44 Stockholm, Sweden<br>
Phone: 087906658<br>
&quot;A satellite, an earring, and a dust bunny are what made America great!&quot;<br>
_______________________________________________<br>
torqueusers mailing list<br>
<a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
<a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
</blockquote></div><br><br clear="all"><br>-- <br>Basappa. Kodada<br>NITK, Surathkal<br>Mangalore<br>
</div>