<div dir="ltr">Hey Guys,<div><br></div><div>I am having some issues with a test torque deployment which only has 1 server and 1 compute node.  I am trying to submit a interactive job and the very first time it works but every subsequent time I get a Reject reply code=15043 and the job just stays queued and sometimes will end up running by giving me a prompt.  I don&#39;t see any network issues and from the OS communication between the server and compute node seem fine.  What am I missing here and what can I check to troubleshoot this further?</div>
<div><br></div><div>--</div><div>server_logs:</div><div>..</div><div><div>11/13/2013 16:30:35;0100;PBS_Server;Job;<a href="http://7221.server1.xxx.com">7221.server1.xxx.com</a>;enqueuing into batch, state 1 hop 1</div><div>
11/13/2013 16:30:35;0008;PBS_Server;Job;<a href="http://7221.server1.xxx.com">7221.server1.xxx.com</a>;Job Queued at request of <a href="mailto:user1@server1.xxx.com">user1@server1.xxx.com</a>, owner = <a href="mailto:user1@server1.xxx.com">user1@server1.xxx.com</a>, job name = STDIN, queue = batch</div>
<div>11/13/2013 16:30:35;0040;PBS_Server;Svr;<a href="http://server1.xxx.com">server1.xxx.com</a>;Scheduler was sent the command new</div><div>11/13/2013 16:30:35;0008;PBS_Server;Job;<a href="http://7221.server1.xxx.com">7221.server1.xxx.com</a>;Job Modified at request of <a href="mailto:Scheduler@server1.xxx.com">Scheduler@server1.xxx.com</a></div>
<div>11/13/2013 16:30:35;0008;PBS_Server;Job;<a href="http://7221.server1.xxx.com">7221.server1.xxx.com</a>;Job Run at request of <a href="mailto:Scheduler@server1.xxx.com">Scheduler@server1.xxx.com</a></div><div>11/13/2013 16:30:36;0004;PBS_Server;Svr;WARNING;ALERT: unable to contact node node1</div>
<div>11/13/2013 16:30:36;0040;PBS_Server;Svr;<a href="http://server1.xxx.com">server1.xxx.com</a>;Scheduler was sent the command recyc</div><div>11/13/2013 16:31:01;0100;PBS_Server;Job;<a href="http://7222.server1.xxx.com">7222.server1.xxx.com</a>;enqueuing into batch, state 1 hop 1</div>
<div>11/13/2013 16:31:01;0008;PBS_Server;Job;<a href="http://7222.server1.xxx.com">7222.server1.xxx.com</a>;Job Queued at request of <a href="mailto:user1@server1.xxx.com">user1@server1.xxx.com</a>, owner = <a href="mailto:user1@server1.xxx.com">user1@server1.xxx.com</a>, job name = STDIN, queue = batch</div>
<div>11/13/2013 16:31:01;0040;PBS_Server;Svr;<a href="http://server1.xxx.com">server1.xxx.com</a>;Scheduler was sent the command new</div><div>11/13/2013 16:31:01;0008;PBS_Server;Job;<a href="http://7222.server1.xxx.com">7222.server1.xxx.com</a>;Job Modified at request of <a href="mailto:Scheduler@server1.xxx.com">Scheduler@server1.xxx.com</a></div>
<div>11/13/2013 16:31:01;0008;PBS_Server;Job;<a href="http://7222.server1.xxx.com">7222.server1.xxx.com</a>;Job Run at request of <a href="mailto:Scheduler@server1.xxx.com">Scheduler@server1.xxx.com</a></div><div>11/13/2013 16:31:03;0008;PBS_Server;Job;<a href="http://7222.server1.xxx.com">7222.server1.xxx.com</a>;unable to run job, MOM rejected/rc=2</div>
<div><b>11/13/2013 16:31:03;0080;PBS_Server;Req;req_reject;Reject reply code=15043(Execution server rejected request MSG=cannot send job to mom, state=PRERUN), aux=0, type=RunJob, from <a href="mailto:Scheduler@server1.xxx.com">Scheduler@server1.xxx.com</a></b></div>
<div>11/13/2013 16:31:03;0008;PBS_Server;Job;<a href="http://7222.server1.xxx.com">7222.server1.xxx.com</a>;Job Modified at request of <a href="mailto:Scheduler@server1.xxx.com">Scheduler@server1.xxx.com</a></div><div>11/13/2013 16:31:03;0040;PBS_Server;Svr;<a href="http://server1.xxx.com">server1.xxx.com</a>;Scheduler was sent the command recyc</div>
<div>..</div></div><div><br></div><div><br></div><div>Thanks,</div><div>-J</div></div>