I am a beginner to Linux and Clustering<br><br>I&#39;m making a Linux cluster system.<br><br>I tested clustering by 2computers(head.NTVT and node4.NTVT)<br><br>I installed torque-2.4.8 and mpich 1.2.7p1.<br><br>pbsnodes -a is ok.....<br>
<br>I shared passwd of ssh. So, I can access any computer without ssh passwd.<br><br>I executed qsub with simple hello script file.<br><br>#!/bin/sh<br>echo Hello World<br><br>And then, When I type qstat -f or qstat -ns<br>
Everything looks like ok..<br><br>Job Id: 158.head.ntvt<br>    Job_Name = hello<br>    Job_Owner = root@head.ntvt<br>    resources_used.cput = 00:00:00<br>    resources_used.mem = 0kb<br>    resources_used.vmem = 0kb<br>    resources_used.walltime = 00:00:00<br>
    job_state = E<br>    queue = pbsq_day<br>    server = head.ntvt<br>    Checkpoint = u<br>    ctime = Tue Jul 13 16:32:37 2010<br>    Error_Path = head.ntvt:/NPB/hello.e158<br>    exec_host = node4.NTVT/0<br>    Hold_Types = n<br>
    Join_Path = n<br>    Keep_Files = n<br>    Mail_Points = a<br>    mtime = Tue Jul 13 16:32:37 2010<br>    Output_Path = head.ntvt:/NPB/hello.o158<br>    Priority = 0<br>    qtime = Tue Jul 13 16:32:37 2010<br>    Rerunable = True<br>
    session_id = 4553<br>    substate = 51<br>    Variable_List = PBS_O_HOME=/root,PBS_O_LANG=ko_KR.UTF-8,PBS_O_LOGNAME=root,<br>    PBS_O_PATH=usr/mpich/bin:usr/mpich/bin:/usr/lib64/qt-3.3/bin:/usr/ker<br>    beros/sbin:/usr/kerberos/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin<br>
    :/usr/sbin:/usr/bin:/usr/X11R6/bin:/root/bin:/usr/mpich/bin:usr/local/<br>    bin:/usr/local/bin,PBS_O_MAIL=/var/spool/mail/root,<br>    PBS_O_SHELL=/bin/bash,PBS_SERVER=head.NTVT,PBS_O_WORKDIR=/NPB,<br>    PBS_O_QUEUE=defaultq,PBS_O_HOST=head.ntvt<br>
    euser = root<br>    egroup = root<br>    hashname = 158.head.ntvt<br>    queue_rank = 8<br>    queue_type = E<br>    comment = Job started on Tue Jul 13 at 16:32<br>    etime = Tue Jul 13 16:32:37 2010<br>    exit_status = 0<br>
    submit_args = hello<br>    start_time = Tue Jul 13 16:32:37 2010<br>    start_count = 1<br>    fault_tolerant = False<br><br><br>However, there are not any output, error file in designated folders...Other script programs are the same. So, I checked my server_log files..And I found these messages.<br>
this is a part of messages.<br><br>/server_logs/20100713<br>07/13/2010 16:32:30;0001;PBS_Server;Svr;PBS_Server;LOG_ERROR::is_request, bad attempt to connect from <a href="http://127.0.0.1:1023">127.0.0.1:1023</a> (address not trusted - check entry in server_priv/nodes)<br>
07/13/2010 16:32:32;0001;PBS_Server;Svr;PBS_Server;LOG_ERROR::is_request, bad attempt to connect from <a href="http://127.0.0.1:1023">127.0.0.1:1023</a> (address not trusted - check entry in server_priv/nodes)<br>07/13/2010 16:32:34;0001;PBS_Server;Svr;PBS_Server;LOG_ERROR::is_request, bad attempt to connect from <a href="http://127.0.0.1:1023">127.0.0.1:1023</a> (address not trusted - check entry in server_priv/nodes)<br>
07/13/2010 16:32:36;0001;PBS_Server;Svr;PBS_Server;LOG_ERROR::is_request, bad attempt to connect from <a href="http://127.0.0.1:1023">127.0.0.1:1023</a> (address not trusted - check entry in server_priv/nodes)<br>07/13/2010 16:32:37;0100;PBS_Server;Job;157.head.ntvt;enqueuing into defaultq, state 1 hop 1<br>
07/13/2010 16:32:37;0100;PBS_Server;Job;157.head.ntvt;dequeuing from defaultq, state QUEUED<br>07/13/2010 16:32:37;0100;PBS_Server;Job;157.head.ntvt;enqueuing into pbsq_day, state 1 hop 1<br>07/13/2010 16:32:37;0008;PBS_Server;Job;157.head.ntvt;Job Queued at request of root@head.ntvt, owner = root@head.ntvt, job name = hello, queue = pbsq_day<br>
07/13/2010 16:32:37;0040;PBS_Server;Svr;head.ntvt;Scheduler was sent the command new<br>07/13/2010 16:32:37;0008;PBS_Server;Job;157.head.ntvt;Job Modified at request of Scheduler@head.NTVT<br>07/13/2010 16:32:37;0008;PBS_Server;Job;157.head.ntvt;Job Run at request of Scheduler@head.NTVT<br>
07/13/2010 16:32:37;0040;PBS_Server;Svr;head.ntvt;Scheduler was sent the command recyc<br>07/13/2010 16:32:37;000d;PBS_Server;Job;157.head.ntvt;Not sending email: User does not want mail of this type.<br>07/13/2010 16:32:37;000d;PBS_Server;Job;157.head.ntvt;Not sending email: User does not want mail of this type.<br>
07/13/2010 16:32:37;0010;PBS_Server;Job;157.head.ntvt;Exit_status=0 resources_used.cput=00:00:00 resources_used.mem=0kb resources_used.vmem=0kb resources_used.walltime=00:00:00<br>07/13/2010 16:32:37;0100;PBS_Server;Job;158.head.ntvt;enqueuing into defaultq, state 1 hop 1<br>
07/13/2010 16:32:37;0100;PBS_Server;Job;158.head.ntvt;dequeuing from defaultq, state QUEUED<br>07/13/2010 16:32:37;0100;PBS_Server;Job;158.head.ntvt;enqueuing into pbsq_day, state 1 hop 1<br>07/13/2010 16:32:37;0008;PBS_Server;Job;158.head.ntvt;Job Queued at request of root@head.ntvt, owner = root@head.ntvt, job name = hello, queue = pbsq_day<br>
07/13/2010 16:32:37;0040;PBS_Server;Svr;head.ntvt;Scheduler was sent the command new<br>07/13/2010 16:32:37;0008;PBS_Server;Job;158.head.ntvt;Job Modified at request of Scheduler@head.NTVT<br>07/13/2010 16:32:37;0008;PBS_Server;Job;158.head.ntvt;Job Run at request of Scheduler@head.NTVT<br>
07/13/2010 16:32:37;0040;PBS_Server;Svr;head.ntvt;Scheduler was sent the command recyc<br>07/13/2010 16:32:37;000d;PBS_Server;Job;158.head.ntvt;Not sending email: User does not want mail of this type.<br>07/13/2010 16:32:37;000d;PBS_Server;Job;158.head.ntvt;Not sending email: User does not want mail of this type.<br>
07/13/2010 16:32:37;0010;PBS_Server;Job;158.head.ntvt;Exit_status=0 resources_used.cput=00:00:00 resources_used.mem=0kb resources_used.vmem=0kb resources_used.walltime=00:00:00<br>07/13/2010 16:32:38;0001;PBS_Server;Svr;PBS_Server;LOG_ERROR::is_request, bad attempt to connect from <a href="http://127.0.0.1:1023">127.0.0.1:1023</a> (address not trusted - check entry in server_priv/nodes)<br>
07/13/2010 16:32:40;0001;PBS_Server;Svr;PBS_Server;LOG_ERROR::is_request, bad attempt to connect from <a href="http://127.0.0.1:1023">127.0.0.1:1023</a> (address not trusted - check entry in server_priv/nodes)<br>07/13/2010 16:32:42;0001;PBS_Server;Svr;PBS_Server;LOG_ERROR::is_request, bad attempt to connect from <a href="http://127.0.0.1:1023">127.0.0.1:1023</a> (address not trusted - check entry in server_priv/nodes)<br>
07/13/2010 16:32:44;0001;PBS_Server;Svr;PBS_Server;LOG_ERROR::is_request, bad attempt to connect from <a href="http://127.0.0.1:1023">127.0.0.1:1023</a> (address not trusted - check entry in server_priv/nodes)<br>07/13/2010 16:32:45;000d;PBS_Server;Job;157.head.ntvt;Post job file processing error; job 157.head.ntvt on host node4.NTVT/0<br>
07/13/2010 16:32:45;0100;PBS_Server;Job;157.head.ntvt;dequeuing from pbsq_day, state COMPLETE<br>07/13/2010 16:32:45;0040;PBS_Server;Svr;head.ntvt;Scheduler was sent the command term<br>07/13/2010 16:32:45;000d;PBS_Server;Job;158.head.ntvt;Post job file processing error; job 158.head.ntvt on host node4.NTVT/0<br>
07/13/2010 16:32:45;0100;PBS_Server;Job;158.head.ntvt;dequeuing from pbsq_day, state COMPLETE<br>07/13/2010 16:32:45;0040;PBS_Server;Svr;head.ntvt;Scheduler was sent the command term<br>07/13/2010 16:32:46;0001;PBS_Server;Svr;PBS_Server;LOG_ERROR::is_request, bad attempt to connect from <a href="http://127.0.0.1:1023">127.0.0.1:1023</a> (address not trusted - check entry in server_priv/nodes)<br>
07/13/2010 16:32:48;0001;PBS_Server;Svr;PBS_Server;LOG_ERROR::is_request, bad attempt to connect from <a href="http://127.0.0.1:1023">127.0.0.1:1023</a> (address not trusted - check entry in server_priv/nodes)<br>07/13/2010 16:32:50;0001;PBS_Server;Svr;PBS_Server;LOG_ERROR::is_request, bad attempt to connect from <a href="http://127.0.0.1:1023">127.0.0.1:1023</a> (address not trusted - check entry in server_priv/nodes)<br>
<br>server_priv/nodes looks like this.<br><br>/server_priv/nodes<br>node4.NTVT np=4<br><br>I&#39;m using a root account and NFS.<br><br>I think network may have some errors.. How can I find this error? Please help me..Thank you.<br>

<p> </p>