<div dir="ltr"><div><div><div>What are you using for your scheduler. Are you using pbs_sched? Maui? If you do not have a scheduler running nothing will happen.<br><br></div>Next, make sure your queues are enabled and that scheduling is also enabled. You can check this with qmgr -c &#39;p s&#39;<br>
<br></div>Regards<br><br></div>Ken<br></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Mon, Sep 2, 2013 at 3:34 PM, Hodgess, Erin <span dir="ltr">&lt;<a href="mailto:HodgessE@uhd.edu" target="_blank">HodgessE@uhd.edu</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">




<div>
<div style="direction:ltr;font-size:10pt;font-family:Tahoma">Hello everyone!<br>
<br>
I have torque installed (I hope) on my Ubuntu laptop successfully but the jobs just sit in the queue forever.<br>
<br>
Here is the output from the server_log:<br>
09/02/2013 16:23:12;0002;PBS_Server.2412;Svr;Log;Log opened<br>
09/02/2013 16:23:12;0006;PBS_Server.2412;Svr;PBS_Server;Server localhost started, initialization type = 1<br>
09/02/2013 16:23:12;0002;PBS_Server.2412;Svr;get_default_threads;Defaulting min_threads to 17 threads<br>
09/02/2013 16:23:12;0002;PBS_Server.2412;Svr;Act;Account file /var/spool/torque/server_priv/accounting/20130902 opened<br>
09/02/2013 16:23:12;0040;PBS_Server.2412;Req;setup_nodes;setup_nodes()<br>
09/02/2013 16:23:12;0086;PBS_Server.2412;Svr;PBS_Server;Recovered queue batch<br>
09/02/2013 16:23:12;0002;PBS_Server.2412;Svr;PBS_Server;Expected 1, recovered 1 queues<br>
09/02/2013 16:23:12;0080;PBS_Server.2412;Svr;PBS_Server;8 total files read from disk<br>
09/02/2013 16:23:12;0100;PBS_Server.2412;Job;3.erin-Lenovo-IdeaPad-Y480;enqueuing into batch, state 1 hop 1<br>
09/02/2013 16:23:12;0086;PBS_Server.2412;Job;3.erin-Lenovo-IdeaPad-Y480;Requeueing job, substate: 10 Requeued in queue: batch<br>
09/02/2013 16:23:12;0100;PBS_Server.2412;Job;5.erin-Lenovo-IdeaPad-Y480;enqueuing into batch, state 1 hop 1<br>
09/02/2013 16:23:12;0086;PBS_Server.2412;Job;5.erin-Lenovo-IdeaPad-Y480;Requeueing job, substate: 10 Requeued in queue: batch<br>
09/02/2013 16:23:12;0100;PBS_Server.2412;Job;6.localhost;enqueuing into batch, state 1 hop 1<br>
09/02/2013 16:23:12;0086;PBS_Server.2412;Job;6.localhost;Requeueing job, substate: 10 Requeued in queue: batch<br>
09/02/2013 16:23:12;0002;PBS_Server.2412;Svr;PBS_Server;handle_job_recovery:3<br>
09/02/2013 16:23:12;0006;PBS_Server.2412;Svr;PBS_Server;Using ports Server:15001  Scheduler:15004  MOM:15002 (server: &#39;localhost&#39;)<br>
09/02/2013 16:23:12;0002;PBS_Server.2412;Svr;PBS_Server;Server Ready, pid = 2412, loglevel=0<br>
09/02/2013 16:23:12;0001;PBS_Server.2422;Svr;PBS_Server;LOG_ERROR::Operation now in progress (115) in tcp_connect_sockaddr, Failed when trying to open tcp connection - connect() failed [rc = -2] [addr = <a href="http://127.0.1.1:15003" target="_blank">127.0.1.1:15003</a>]<br>

09/02/2013 16:23:12;0001;PBS_Server.2422;Svr;PBS_Server;LOG_ERROR::send_hierarchy, Could not send mom hierarchy to host erin-Lenovo-IdeaPad-Y480:15003<br>
09/02/2013 16:23:20;0001;PBS_Server.2420;Svr;PBS_Server;LOG_ERROR::svr_is_request, bad attempt to connect from <a href="http://127.0.0.1:651" target="_blank">127.0.0.1:651</a> (address not trusted - check entry in server_priv/nodes)<br>

09/02/2013 16:23:23;0002;PBS_Server.2421;Svr;PBS_Server;Torque Server Version = 4.2.4.1, loglevel = 0<br>
09/02/2013 16:23:28;0100;PBS_Server.2422;Job;7.localhost;enqueuing into batch, state 1 hop 1<br>
09/02/2013 16:23:28;0008;PBS_Server.2422;Job;req_commit;job_id: 7.localhost<br>
09/02/2013 16:23:42;0001;PBS_Server.2421;Svr;PBS_Server;LOG_ERROR::svr_is_request, bad attempt to connect from <a href="http://127.0.0.1:651" target="_blank">127.0.0.1:651</a> (address not trusted - check entry in server_priv/nodes)<br>

09/02/2013 16:23:51;0080;PBS_Server.2422;Job;3.localhost;Unknown Job Id Error<br>
09/02/2013 16:23:51;0080;PBS_Server.2422;Req;req_reject;Reject reply code=15001(Unknown Job Id Error MSG=cannot locate job), aux=0, type=DeleteJob, from root@localhost<br>
09/02/2013 16:23:51;0008;PBS_Server.2420;Job;6.localhost;Job deleted at request of root@localhost<br>
09/02/2013 16:23:51;000d;PBS_Server.2422;Job;6.localhost;Email &#39;d&#39; to erin@localhost failed: Child process &#39;sendmail -f adm erin@localhost&#39; returned 127 (errno 0:Success)<br>
09/02/2013 16:23:56;0008;PBS_Server.2421;Job;6.localhost;on_job_exit valid pjob: 6.localhost (substate=59)<br>
09/02/2013 16:23:56;0100;PBS_Server.2421;Job;6.localhost;dequeuing from batch, state COMPLETE<br>
09/02/2013 16:23:57;0080;PBS_Server.2420;Job;3.localhost;Unknown Job Id Error<br>
09/02/2013 16:23:57;0080;PBS_Server.2420;Req;req_reject;Reject reply code=15001(Unknown Job Id Error MSG=cannot locate job), aux=0, type=DeleteJob, from root@localhost<br>
09/02/2013 16:24:02;0080;PBS_Server.2422;Job;4.localhost;Unknown Job Id Error<br>
09/02/2013 16:24:02;0080;PBS_Server.2422;Req;req_reject;Reject reply code=15001(Unknown Job Id Error MSG=cannot locate job), aux=0, type=DeleteJob, from root@localhost<br>
09/02/2013 16:24:06;0080;PBS_Server.2420;Job;5.localhost;Unknown Job Id Error<br>
09/02/2013 16:24:06;0080;PBS_Server.2420;Req;req_reject;Reject reply code=15001(Unknown Job Id Error MSG=cannot locate job), aux=0, type=DeleteJob, from root@localhost<br>
09/02/2013 16:24:10;0080;PBS_Server.2421;Job;6.localhost;Unknown Job Id Error<br>
09/02/2013 16:24:10;0080;PBS_Server.2421;Req;req_reject;Reject reply code=15001(Unknown Job Id Error MSG=cannot locate job), aux=0, type=DeleteJob, from root@localhost<br>
09/02/2013 16:24:27;0001;PBS_Server.2420;Svr;PBS_Server;LOG_ERROR::svr_is_request, bad attempt to connect from <a href="http://127.0.0.1:651" target="_blank">127.0.0.1:651</a> (address not trusted - check entry in server_priv/nodes)<br>

09/02/2013 16:24:27;0080;PBS_Server.2422;Req;req_reject;Reject reply code=15007(Unauthorized Request ), aux=0, type=RunJob, from erin@localhost<br>
09/02/2013 16:24:32;0040;PBS_Server.2421;Req;node_spec;job allocation request exceeds currently available cluster nodes, 1 requested, 0 available<br>
09/02/2013 16:24:32;0008;PBS_Server.2421;Job;7.localhost;could not locate requested resources &#39;1:ppn=1&#39; (node_spec failed) job allocation request exceeds currently available cluster nodes, 1 requested, 0 available<br>

09/02/2013 16:24:32;0080;PBS_Server.2421;Req;req_reject;Reject reply code=15046(Resource temporarily unavailable MSG=job allocation request exceeds currently available cluster nodes, 1 requested, 0 available), aux=0, type=RunJob, from root@localhost<br>

09/02/2013 16:25:12;0001;PBS_Server.2420;Svr;PBS_Server;LOG_ERROR::svr_is_request, bad attempt to connect from <a href="http://127.0.0.1:651" target="_blank">127.0.0.1:651</a> (address not trusted - check entry in server_priv/nodes)<br>

09/02/2013 16:25:57;0001;PBS_Server.2420;Svr;PBS_Server;LOG_ERROR::svr_is_request, bad attempt to connect from <a href="http://127.0.0.1:651" target="_blank">127.0.0.1:651</a> (address not trusted - check entry in server_priv/nodes)<br>

09/02/2013 16:26:42;0001;PBS_Server.2421;Svr;PBS_Server;LOG_ERROR::svr_is_request, bad attempt to connect from <a href="http://127.0.0.1:651" target="_blank">127.0.0.1:651</a> (address not trusted - check entry in server_priv/nodes)<br>

09/02/2013 16:27:27;0001;PBS_Server.2422;Svr;PBS_Server;LOG_ERROR::svr_is_request, bad attempt to connect from <a href="http://127.0.0.1:651" target="_blank">127.0.0.1:651</a> (address not trusted - check entry in server_priv/nodes)<br>

09/02/2013 16:28:12;0001;PBS_Server.2420;Svr;PBS_Server;LOG_ERROR::svr_is_request, bad attempt to connect from <a href="http://127.0.0.1:651" target="_blank">127.0.0.1:651</a> (address not trusted - check entry in server_priv/nodes)<br>

09/02/2013 16:28:31;0002;PBS_Server.2421;Svr;PBS_Server;Torque Server Version = 4.2.4.1, loglevel = 0<br>
09/02/2013 16:28:57;0001;PBS_Server.2421;Svr;PBS_Server;LOG_ERROR::svr_is_request, bad attempt to connect from <a href="http://127.0.0.1:651" target="_blank">127.0.0.1:651</a> (address not trusted - check entry in server_priv/nodes)<br>

09/02/2013 16:29:42;0001;PBS_Server.2420;Svr;PBS_Server;LOG_ERROR::svr_is_request, bad attempt to connect from <a href="http://127.0.0.1:651" target="_blank">127.0.0.1:651</a> (address not trusted - check entry in server_priv/nodes)<br>

09/02/2013 16:30:27;0001;PBS_Server.2422;Svr;PBS_Server;LOG_ERROR::svr_is_request, bad attempt to connect from <a href="http://127.0.0.1:651" target="_blank">127.0.0.1:651</a> (address not trusted - check entry in server_priv/nodes)<br>

<br>
from pbsnodes:<br>
pbsnodes<br>
erin-Lenovo-IdeaPad-Y480<br>
     state = down<br>
     np = 8<br>
     ntype = cluster<br>
     mom_service_port = 15002<br>
     mom_manager_port = 15003<br>
<br>
Does any of this look familiar, please?  Any help would be much appreciated.<br>
<br>
Sincerely,<br>
Erin<br>
<br>
</div>
</div>

<br>_______________________________________________<br>
torqueusers mailing list<br>
<a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
<a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
<br></blockquote></div><br><br clear="all"><br>-- <br>Ken Nielson<br>+1 801.717.3700 office +1 801.717.3738 fax<br>1712 S. East Bay Blvd, Suite 300  Provo, UT  84606<br><a href="http://www.adaptivecomputing.com" target="_blank">www.adaptivecomputing.com</a><br>
<br>
</div>