<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
</head>
<body bgcolor="#ffffff" text="#000000">
<meta http-equiv="CONTENT-TYPE" content="text/html; charset=utf-8">
<title></title>
<meta name="GENERATOR" content="OpenOffice.org 2.3  (Linux)">
<style type="text/css">
        <!--
                @page { size: 21cm 29.7cm; margin: 2cm }
                P { margin-bottom: 0.21cm }
        -->
        </style>Hello,
<br>
<br>
we are running Torque-2.3.6 and
Maui-3.2.6p21 at our cluster. Sometimes happens following:
<br>
<br>
The job requesting more worker nodes
(for example nodes=8:ppn=2) is queued and starts at average in one
hour even the requested resources are available. Exactly there are no
fully free worker nodes available but there is a sufficient amount of
partially free worker nodes.
<br>
There is no clear reason in the output
of checkjob.
<br>
<br>
>From checkjob:
<br>
checking job 8037
<br>
<br>
State: Idle
<br>
Creds: user:black group:users class:batch qos:DEFAULT
<br>
WallTime: 00:00:00 of 41:16:00:00
<br>
SubmitTime: Mon May 18 15:45:34
<br>
(Time Queued Total: 00:31:51 Eligible: 00:31:51)
<br>
<br>
StartDate: 00:00:01 Mon May 18
16:17:26
<br>
Total Tasks: 16
<br>
<br>
Req[0] TaskCount: 16 Partition: ALL
<br>
Network: [NONE] Memory &gt;= 0 Disk
&gt;= 0 Swap &gt;= 0
<br>
Opsys: [NONE] Arch: [NONE] Features:
[batch]
<br>
<br>
IWD: [NONE] Executable: [NONE]
<br>
Bypass: 0 StartCount: 0
<br>
PartitionMask: [ALL]
<br>
Flags: RESTARTABLE
<br>
<br>
Reservation '8037' (00:00:01 -&gt;
41:16:00:01 Duration: 41:16:00:00)
<br>
PE: 16.00 StartPriority: 31
<br>
cannot select job 8037 for partition
DEFAULT (startdate in '00:00:01')
<br>
<br>
<br>
>From Maui configuration:
<br>
RMPOLLINTERVAL&nbsp;&nbsp; 00:00:30
<br>
BACKFILLPOLICY&nbsp;&nbsp; FIRSTFIT
<br>
RESERVATIONPOLICY&nbsp;&nbsp; CURRENTHIGHEST
<br>
NODEALLOCATIONPOLICY&nbsp;&nbsp; CPULOAD
<br>
ENABLEMULTIREQJOBS&nbsp;&nbsp; TRUE
<br>
JOBNODEMATCHPOLICY&nbsp;&nbsp; EXACTNODE
<br>
<br>
<br>
>From tracejob:
<br>
05/18/2009 15:45:34 S enqueuing
into batch, state 1 hop 1
<br>
05/18/2009 <font color="#000000"><b>15:45:34</b></font><font
 color="#000000"> S Job Queued at request ...</font>
<br>
<font color="#000000">05/18/2009
15:45:34 A queue=batch</font>
<br>
<font color="#000000">05/18/2009
16:56:25 S Job Modified at request ...</font>
<br>
<font color="#000000">05/18/2009
<b>16:56:25</b> S Job Run at request ...</font>
<br>
<font color="#000000">05/18/2009
16:56:25 S Job Modified at request ...</font>
<br>
<br>
<br>
Can anybody explain this strange
behaviour?
<br>
What does the expresion &#8220;cannot
select job 8037 for partition DEFAULT&#8220; without any further reason
mean?
<br>
<br>
<br>
Thank you.
<br>
<br>
Best regards
<br>
<br>
Jana Uhlirova<br>
<br>
</body>
</html>