<div>Hi all,<br>
<br>
I am new to installing Torque PBS and Maui. My system is a one
dual-processor dual-core server for testing purposes, where I try
things out before getting the actual cluster. I have installed both
Torque PBS and this seems to work fine. Then I installed Maui and used
the file maui.cfg as below, aside from telling that the queue system is
PBS I did not change anything.<br>
<br>
Now the behavior is that I can start the 'maui' demon, issue 'showq'
and see the queue, but when I submit a job, the maui demon seems to
stop by itself. Then, when I issue "showq" I get<br>
<br>
[behi@RHE4Server 1proc]$ showq<br>
ERROR:&nbsp;&nbsp;&nbsp; cannot send request to server localhost.localdomain:42559 (server may not be running)<br>
ERROR:&nbsp;&nbsp;&nbsp; cannot request service (status)<br>
<br>
I have appended the lines generated in maui.log below.<br>
The job runs fine and I can also submit several jobs, which are just
done in the order submitted. I can also restart maui and repeat this
procedure.<br>
<br>
Does anybody have an idea where I should be looking to figure out what
is wrong? I would be grateful on any hints on how to get started.<br>
Best, Berit<br>
<br><div>--------------------------------------<br>Berit Hinnemann<br>Research Scientist<br>Haldor Topsøe A/S<br>---------------------------------------<br>
-------------------------------------------------------------------------------------------------------------------------------------<br>

output from maui.log upon submitting a job<br>

12/13 16:23:35 INFO:&nbsp;&nbsp;&nbsp;&nbsp; scheduling complete.&nbsp; sleeping 30 seconds<br>

12/13 16:24:06 ServerProcessRequests()<br>

12/13 16:24:06 INFO:&nbsp;&nbsp;&nbsp;&nbsp; not rolling logs (585245 &lt; 10000000)<br>

12/13 16:24:06 MResAdjust(NULL,0,0)<br>

12/13 16:24:06 MStatInitializeActiveSysUsage()<br>

12/13 16:24:06 MStatClearUsage([NONE],Active)<br>

12/13 16:24:06 ServerUpdate()<br>

12/13 16:24:06 MSysUpdateTime()<br>

12/13 16:24:06 INFO:&nbsp;&nbsp;&nbsp;&nbsp; starting iteration 7<br>

12/13 16:24:06 MRMGetInfo()<br>

12/13 16:24:06 MClusterClearUsage()<br>

12/13 16:24:06 MRMClusterQuery()<br>

12/13 16:24:06 MPBSClusterQuery(localhost.localdomain,RCount,SC)<br>

12/13 16:24:06 __MPBSGetNodeState(Name,State,PNode)<br>

12/13 16:24:06 INFO:&nbsp;&nbsp;&nbsp;&nbsp; PBS node localhost.localdomain set to state Busy (job-exclusive)<br>

12/13 16:24:06 INFO:&nbsp;&nbsp;&nbsp;&nbsp; node 'localhost.localdomain' changed states from Idle to Busy<br>

12/13 16:24:06 ALERT:&nbsp;&nbsp;&nbsp; unexpected node transition on node 'localhost.localdomain'&nbsp; Idle -&gt; Busy<br>

12/13 16:24:06 MPBSNodeUpdate(localhost.localdomain,localhost.localdomain,Busy,localhost.localdomain)<br>

12/13 16:24:06 INFO:&nbsp;&nbsp;&nbsp;&nbsp; node localhost.localdomain has joblist
'0/10.localhost.localdomain, 1/10.localhost.localdomain,
2/10.localhost.localdomain, 3/10.localhost.localdomain'<br>

12/13 16:24:06 ALERT:&nbsp;&nbsp;&nbsp; cannot locate PBS job '10.localhost.localdomain' (running on node localhost.localdomain)<br>

12/13 16:24:06 ALERT:&nbsp;&nbsp;&nbsp; cannot locate PBS job '10.localhost.localdomain' (running on node localhost.localdomain)<br>

12/13 16:24:06 ALERT:&nbsp;&nbsp;&nbsp; cannot locate PBS job '10.localhost.localdomain' (running on node localhost.localdomain)<br>

12/13 16:24:06 ALERT:&nbsp;&nbsp;&nbsp; cannot locate PBS job '10.localhost.localdomain' (running on node localhost.localdomain)<br>

12/13 16:24:06 MPBSLoadQueueInfo(localhost.localdomain,localhost.localdomain,SC)<br>

12/13 16:24:06 INFO:&nbsp;&nbsp;&nbsp;&nbsp; queue 'batch' started state set to True<br>

12/13 16:24:06 INFO:&nbsp;&nbsp;&nbsp;&nbsp; class to node not mapping enabled for queue 'batch' adding class to all nodes<br>

12/13 16:24:06 INFO:&nbsp;&nbsp;&nbsp;&nbsp; 1 PBS resources detected on RM localhost.localdomain<br>

12/13 16:24:06 INFO:&nbsp;&nbsp;&nbsp;&nbsp; resources detected: 1<br>

12/13 16:24:06 MRMWorkloadQuery()<br>

12/13 16:24:06 MPBSWorkloadQuery(localhost.localdomain,JCount,SC)<br>

12/13 16:24:06 MPBSJobLoad(10,10.localhost.localdomain,J,TaskList,0)<br>

12/13 16:24:06 MReqCreate(10,SrcRQ,DstRQ,DoCreate)<br>

12/13 16:24:06 INFO:&nbsp;&nbsp;&nbsp;&nbsp; processing node request line '1:ppn=4'<br>

12/13 16:24:06 MJobSetCreds(10,behi,behi,)<br>
12/13 16:24:06 INFO:&nbsp;&nbsp;&nbsp;&nbsp; default QOS for job 10 set
to DEFAULT(0) (P:DEFAULT,U:[NONE],G:[NONE],A:[NONE],C:[NONE])<br>
12/13 16:24:06 INFO:&nbsp;&nbsp;&nbsp;&nbsp; default QOS for job 10 set
to DEFAULT(0) (P:DEFAULT,U:[NONE],G:[NONE],A:[NONE],C:[NONE])<br>
12/13 16:24:06 INFO:&nbsp;&nbsp;&nbsp;&nbsp; default QOS for job 10 set
to DEFAULT(0) (P:DEFAULT,U:[NONE],G:[NONE],A:[NONE],C:[NONE])<br>

12/13 16:24:06 MResJCreate(10,MNodeList,-00:00:10,ActiveJob,Res)<br>

12/13 16:24:06 MStatUpdateActiveJobUsage(10)<br>

---------------------------------------------------------------------------------------------------------------------------------------<br>
maui.cfg<br>
# maui.cfg 3.2.6p18<br>
<br>
SERVERHOST&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; localhost.localdomain<br>
# primary admin must be first in list<br>
ADMIN1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; root<br>
<br>
# Resource Manager Definition<br>
<br>
RMCFG[localhost.localdomain] TYPE=PBS<br>
<br>
# Allocation Manager Definition<br>
<br>
AMCFG[bank]&nbsp; TYPE=NONE<br>
<br>
# full parameter docs at http://supercluster.org/mauidocs/a.fparameters.html<br>
# use the 'schedctl -l' command to display current configuration<br>
<br>
RMPOLLINTERVAL&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 00:00:30<br>
<br>
SERVERPORT&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 42559<br>
SERVERMODE&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; NORMAL<br>
<br>
# Admin: http://supercluster.org/mauidocs/a.esecurity.html<br>
<br>
<br>
LOGFILE&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; maui.log<br>
LOGFILEMAXSIZE&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 10000000<br>
LOGLEVEL&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 3<br>
<br>
# Job Priority: http://supercluster.org/mauidocs/5.1jobprioritization.html<br>
<br>
QUEUETIMEWEIGHT&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1<br>
<br>
# FairShare: http://supercluster.org/mauidocs/6.3fairshare.html<br>
<br>
#FSPOLICY&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; PSDEDICATED<br>
#FSDEPTH&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 7<br>
#FSINTERVAL&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 86400<br>
#FSDECAY&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0.80<br>
<br>
# Throttling Policies: http://supercluster.org/mauidocs/6.2throttlingpolicies.html<br>
<br>
# NONE SPECIFIED<br>
<br>
# Backfill: http://supercluster.org/mauidocs/8.2backfill.html<br>
<br>
BACKFILLPOLICY&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; FIRSTFIT<br>
RESERVATIONPOLICY&nbsp;&nbsp;&nbsp;&nbsp; CURRENTHIGHEST<br>
<br>
# Node Allocation: http://supercluster.org/mauidocs/5.2nodeallocation.html<br>
<br>
NODEALLOCATIONPOLICY&nbsp; MINRESOURCE<br>
<br>
# QOS: http://supercluster.org/mauidocs/7.3qos.html<br>
<br>
# QOSCFG[hi]&nbsp; PRIORITY=100 XFTARGET=100 FLAGS=PREEMPTOR:IGNMAXJOB<br>
# QOSCFG[low] PRIORITY=-1000 FLAGS=PREEMPTEE<br>
<br>
# Standing Reservations: http://supercluster.org/mauidocs/7.1.3standingreservations.html<br>
<br>
# SRSTARTTIME[test] 8:00:00<br>
# SRENDTIME[test]&nbsp;&nbsp; 17:00:00<br>
# SRDAYS[test]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; MON TUE WED THU FRI<br>
# SRTASKCOUNT[test] 20<br>
# SRMAXTIME[test]&nbsp;&nbsp; 0:30:00<br>
<br>
# Creds: http://supercluster.org/mauidocs/6.1fairnessoverview.html<br>
<br>
# USERCFG[DEFAULT]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; FSTARGET=25.0<br>
# USERCFG[john]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; PRIORITY=100&nbsp; FSTARGET=10.0-<br>
# GROUPCFG[staff]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; PRIORITY=1000 QLIST=hi:low QDEF=hi<br>
# CLASSCFG[batch]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; FLAGS=PREEMPTEE<br>
# CLASSCFG[interactive] FLAGS=PREEMPTOR<br>
<br></div></div>