<div>Tail /var/log/messages : </div><div><br></div><div>PBS_Server: LOG_ERROR::wait_request, connection 9 to host 168430808 has timed out after 900 seconds - closing stale connection</div><div><br></div><span class="Apple-style-span" style="background-color: rgb(255, 255, 0);">My configuration of queue is </span>: <div>
<br></div><div><div>#</div><div># Create queues and set their attributes.</div><div>#</div><div>#</div><div># Create and define queue paralela</div><div>#</div><div>create queue paralela</div><div>set queue paralela queue_type = Execution</div>
<div>set queue paralela enabled = True</div><div>set queue paralela started = True</div><div><br></div><div><br></div><div>#</div><div># Create and define queue serial</div><div>#</div><div>create queue serial</div><div>set queue serial queue_type = Execution</div>
<div>set queue serial resources_default.nodes = 1</div><div>set queue serial resources_default.walltime = 01:00:00</div><div>set queue serial enabled = True</div><div>set queue serial started = True</div><div><br></div><div>
<br></div><div><br></div><div>#</div><div># Set server attributes.</div><div>#</div><div>set server scheduling = True</div><div>set server acl_hosts = master</div><div>set server managers = mpiX@master</div><div>set server default_queue = serial</div>
<div>set server log_events = 511</div><div>set server mail_from = adm</div><div>set server scheduler_iteration = 600</div><div>set server node_check_rate = 150</div><div>set server tcp_timeout = 6</div><div>set server next_job_number = 9</div>
<div><br></div><div><br></div><div><br></div><div><span class="Apple-style-span" style="background-color: rgb(255, 255, 0);">Nodes :</span> </div><div><br></div><div>Master : master</div><div>slaves  : quad2 </div><div>              quad4</div>
<div><br></div><div><br></div><div>On master using qsub command :  qsub run.sh <br></div><div><br></div><div><br></div><div><br></div><div><span class="Apple-style-span" style="background-color: rgb(255, 255, 0);">pbsnodes -a :</span></div>
<div><div>quad2</div><div>     state = free</div><div>     np = 3</div><div>     ntype = cluster</div><div>     status = opsys=linux,uname=Linux quad2 2.6.31.12-174.2.22.fc12.x86_64 #1 SMP Fri Feb 19 18:55:03 UTC 2010 x86_64,sessions=1405 1512 1486 1563 1570 1582 1602 1616 1647 1753 1755 1777 1799 1832 2012 2043 2044 1681 2540 2550 2632 2633 2647 2666 2674 2691 2927 2955,nsessions=28,nusers=5,idletime=92,totmem=20445056kb,availmem=14304140kb,physmem=4058764kb,ncpus=4,loadave=2.47,netload=41652360053,state=free,jobs=,varattr=,rectime=1270498149</div>
<div><br></div><div>quad4</div><div>     state = free</div><div>     np = 8</div><div>     ntype = cluster</div><div>     status = opsys=linux,uname=Linux quad4 2.6.31.12-174.2.3.fc12.x86_64 #1 SMP Mon Jan 18 19:52:07 UTC 2010 x86_64,sessions=1542 1678 1682 1683 1707 1729 8220 9493,nsessions=8,nusers=3,idletime=443582,totmem=55461328kb,availmem=54327508kb,physmem=24745056kb,ncpus=8,loadave=0.00,netload=1666289018,state=free,jobs=,varattr=,rectime=1270498149</div>
</div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br>-- <br>Abraham Zamudio Ch.<br><br>
</div></div>