<html><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div>* Are the host keys already in the known_hosts file?</div>* Are you able to ssh between the 2 nodes without giving a password?<div><br></div><div>Prakash</div><div><br><div><div>On Sep 2, 2008, at 10:43 PM, Ye YC Cui wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div><p><font size="5" face="Times New Roman">Hi all</font><br> <font size="5" face="Times New Roman">If we run command : qstat -f </font><br> <font size="5" face="Times New Roman">We can get log as follow:</font><br> <font face="Times New Roman">Job Id: 216.M_02</font><br> <font face="Times New Roman">    Job_Name = STDIN</font><br> <font face="Times New Roman">    Job_Owner = user1@M_01</font><br> <font face="Times New Roman">    resources_used.cput = 00:00:00</font><br> <font face="Times New Roman">    resources_used.mem = 0kb</font><br> <font face="Times New Roman">    resources_used.vmem = 0kb</font><br> <font face="Times New Roman">    resources_used.walltime = 00:00:00</font><br> <font face="Times New Roman">    job_state = C</font><br> <font face="Times New Roman">    queue = batch</font><br> <font face="Times New Roman">    server = M_02</font><br> <font face="Times New Roman">    Checkpoint = u</font><br> <font face="Times New Roman">    ctime = Tue Sep  2 05:20:50 2008</font><br> <font face="Times New Roman">    Error_Path = M_01:/home/user1/STDIN.e216</font><br> <font face="Times New Roman">    exec_host = M_02/0</font><br> <font face="Times New Roman">    Hold_Types = n</font><br> <font face="Times New Roman">    Join_Path = n</font><br> <font face="Times New Roman">    Keep_Files = n</font><br> <font face="Times New Roman">    Mail_Points = a</font><br> <font face="Times New Roman">    mtime = Tue Sep  2 05:20:59 2008</font><br> <font face="Times New Roman">    Output_Path = M_01:/home/user1/STDIN.o216</font><br> <font face="Times New Roman">    Priority = 0</font><br> <font face="Times New Roman">    qtime = Tue Sep  2 05:20:50 2008</font><br> <font face="Times New Roman">    Rerunable = True</font><br> <font face="Times New Roman">    Resource_List.nodect = 1</font><br> <font face="Times New Roman">    Resource_List.nodes = M_02</font><br> <font face="Times New Roman">    Resource_List.walltime = 01:00:00</font><br> <font face="Times New Roman">    session_id = 4848</font><br> <font face="Times New Roman">    Variable_List = PBS_O_HOME=/home/user1,PBS_O_LANG=en_US.UTF-8,</font><br> <font face="Times New Roman">        PBS_O_LOGNAME=user1,</font><br> <font face="Times New Roman">        PBS_O_PATH=/usr/mpi/gcc/mvapich2-1.0.3/bin:/usr/kerberos/bin:/opt/csm</font><br> <font face="Times New Roman">        /bin:/usr/local/bin:/bin:/usr/bin:/var/spool/torque:/home/user1/bin,</font><br> <font face="Times New Roman">        PBS_O_MAIL=/var/spool/mail/user1,PBS_O_SHELL=/bin/bash,</font><br> <font face="Times New Roman">        PBS_SERVER=M_01,PBS_O_HOST=M_01,PBS_O_WORKDIR=/home/user1,</font><br> <font face="Times New Roman">        PBS_O_QUEUE=batch</font><br> <font face="Times New Roman">    sched_hint = Post job file processing error; job 216.M_02 on host gaia-</font><br> <font face="Times New Roman">        08/0</font><br> <br> <font color="#FF0000" face="Times New Roman">Unable to copy file /var/spool/torque/spool/216.M_02.OU to ad</font><br> <font color="#FF0000" face="Times New Roman">        min1@M_01:/home/user1/STDIN.o216</font><br> <font face="Times New Roman">>>> error from copy</font><br> <font face="Times New Roman">Host key veri</font><br> <font face="Times New Roman">        fication failed.</font><br> <font face="Times New Roman">lost connection</font><br> <font face="Times New Roman">>>> end error output</font><br> <font face="Times New Roman">Output retained</font><br> <font face="Times New Roman">         on that host in: /var/spool/torque/undelivered/216.M_02.OU</font><br> <br> <font face="Times New Roman">Unable</font><br> <font face="Times New Roman">         </font><font color="#FF0000" face="Times New Roman">to copy file /var/spool/torque/spool/216.M_02.ER to user1@M_01</font><br> <font color="#FF0000" face="Times New Roman">        :/home/user1/STDIN.e216</font><br> <font face="Times New Roman">>>> error from copy</font><br> <font face="Times New Roman">Host key verification fai</font><br> <font face="Times New Roman">        led.</font><br> <font face="Times New Roman">lost connection</font><br> <font face="Times New Roman">>>> end error output</font><br> <font face="Times New Roman">Output retained on that hos</font><br> <font face="Times New Roman">        t in: /var/spool/torque/undelivered/216.M_02.ER</font><br> <font face="Times New Roman">    comment = Job started on Tue Sep 02 at 05:20</font><br> <font face="Times New Roman">    etime = Tue Sep  2 05:20:50 2008</font><br> <font face="Times New Roman">    exit_status = 0</font><br> <font face="Times New Roman">    submit_args = -l nodes=M_02</font><br> <font face="Times New Roman">    start_time = Tue Sep  2 05:20:50 2008</font><br> <font face="Times New Roman">    start_count = 1</font><br> <br> <font size="4" face="Times New Roman">In my opinion :</font> </p><ul type="disc"> <li><font size="4" face="Times New Roman">To copy file from node1 to node2 is unavailable.</font> </li><li><font size="4" face="Times New Roman">Job submitted user1 do not have right to copy between node1 and node1.(I have do ./configure --with-scp)</font></li></ul> <br> <br> <span>&lt;graycol.gif></span><font color="#424282">Ye YC Cui---09/02/2008 10:54:38 PM---Hi all,</font><br> <br> <br> <font size="5">Hi all,<br> As we know the PBS batch file may be specified as a filename on the </font><b><font size="5">qsub</font></b><font size="5"> command line or may be entered via STDIN. </font><font size="2"><br> For example :<br> STDIN.e.100<br> STDIN.o.100<br> But when we use node1 to submit a job and order node2 to execute the job,<br> we can not find STDIN.* files.<br> Could you tell me it is right or wrong?</font><font size="4"><br> <br> Simon Cui ( 崔野)<br> IBM China Software Development LAB, Beijing<br> Tel: 86-10-82782244 ext 54955 E-mail: <a href="mailto:cuiye@cn.ibm.com">cuiye@cn.ibm.com</a><br> Address: 2/F, DeShi Building, No.9, East Road, ShangDi, Beijing 100085, P.R.China<br> MSN: <a href="mailto:cuiye_forevery@hotmail.com">cuiye_forevery@hotmail.com</a></font><font size="1"><br> </font><tt>_______________________________________________<br> torqueusers mailing list<br> <a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br> </tt><tt><a href="http://www.supercluster.org/mailman/listinfo/torqueusers">http://www.supercluster.org/mailman/listinfo/torqueusers</a></tt><tt><br> </tt><font size="1"><br> </font><br> </div> _______________________________________________<br>torqueusers mailing list<br><a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>http://www.supercluster.org/mailman/listinfo/torqueusers<br></blockquote></div><br></div></body></html>