Hello,<br><br>I&#39;m having a problem draining my cluster&#39;s batch queues using setres. Adapting one of the examples given in the clusterresources documentation I attempt to reserve every node and processor in my cluster during our scheduled downtime:<br>
<br># setres&nbsp; -s 18:00:00_11/18 -e 08:00:00_11/19 -n electricityDowntime ALL<br><br><br>I then check the reservations and see that the downtime is there and is applied to all processors along with a few other reservations for pre-existing jobs.<br>
<br>To test the reservation I submit a job which requests an excessive amount of wallclock time (Job 918). It&#39;s scheduled to start when the downtime finishes which is what I expect:<br><br>[root@lphesrv1 spool]# showres<br>
Reservations<br><br>ReservationID&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Type S&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Start&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; End&nbsp;&nbsp;&nbsp; Duration&nbsp;&nbsp;&nbsp; N/P&nbsp; StartTime<br><br>909&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job R&nbsp;&nbsp;&nbsp; -1:21:00 83:06:39:00 83:08:00:00&nbsp;&nbsp;&nbsp; 1/1&nbsp; Mon Nov 10 15:40:32<br>912&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job R&nbsp;&nbsp;&nbsp; -1:09:05&nbsp; 4:12:50:55&nbsp; 4:14:00:00&nbsp;&nbsp;&nbsp; 1/1&nbsp; Mon Nov 10 15:52:27<br>
913&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job R&nbsp;&nbsp; -00:49:57&nbsp; 4:13:10:03&nbsp; 4:14:00:00&nbsp;&nbsp;&nbsp; 1/1&nbsp; Mon Nov 10 16:11:35<br>918&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job I&nbsp; 8:14:58:28 91:22:58:28 83:08:00:00&nbsp;&nbsp;&nbsp; 1/1&nbsp; Wed Nov 19 08:00:00<br>electricityDowntime.0&nbsp; User -&nbsp; 8:00:58:28&nbsp; 8:14:58:28&nbsp;&nbsp;&nbsp; 14:00:00 60/480&nbsp; Tue Nov 18 18:00:00<br>
<br>17 reservations located<br><br><br>Unfortunately, upon checking the reservations ~ 10minutes later I find that Job 918 has started despite the reservations overlapping:<br><br><br>[root@lphesrv1 spool]# showres<br>Reservations<br>
<br>ReservationID&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Type S&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Start&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; End&nbsp;&nbsp;&nbsp; Duration&nbsp;&nbsp;&nbsp; N/P&nbsp; StartTime<br><br>909&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job R&nbsp;&nbsp;&nbsp; -1:27:25 83:06:32:35 83:08:00:00&nbsp;&nbsp;&nbsp; 1/1&nbsp; Mon Nov 10 15:40:32<br>912&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job R&nbsp;&nbsp;&nbsp; -1:15:30&nbsp; 4:12:44:30&nbsp; 4:14:00:00&nbsp;&nbsp;&nbsp; 1/1&nbsp; Mon Nov 10 15:52:27<br>
913&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job R&nbsp;&nbsp; -00:56:22&nbsp; 4:13:03:38&nbsp; 4:14:00:00&nbsp;&nbsp;&nbsp; 1/1&nbsp; Mon Nov 10 16:11:35<br>918&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job R&nbsp;&nbsp; -00:06:15 83:07:53:45 83:08:00:00&nbsp;&nbsp;&nbsp; 1/1&nbsp; Mon Nov 10 17:01:42<br>electricityDowntime.0&nbsp; User -&nbsp; 8:00:52:03&nbsp; 8:14:52:03&nbsp;&nbsp;&nbsp; 14:00:00 60/480&nbsp; Tue Nov 18 18:00:00<br>
<br>17 reservations located<br><br><br>Can anyone help me debug this/explain this behaviour? I can&#39;t find anything in my maui dir logs and only:<br><br>11/10/2008 17:01:42;0100;PBS_Server;Req;;Type StatusJob request received from <a href="mailto:root@lphesrv1.epfl.ch">root@lphesrv1.epfl.ch</a>, sock=14<br>
11/10/2008 17:01:42;0100;PBS_Server;Req;;Type ModifyJob request received from <a href="mailto:root@lphesrv1.epfl.ch">root@lphesrv1.epfl.ch</a>, sock=14<br>11/10/2008 17:01:42;0008;PBS_Server;Job;<a href="http://918.lphesrv1.epfl.ch">918.lphesrv1.epfl.ch</a>;Job Modified at request of <a href="mailto:root@lphesrv1.epfl.ch">root@lphesrv1.epfl.ch</a><br>
11/10/2008 17:01:42;0100;PBS_Server;Req;;Type RunJob request received from <a href="mailto:root@lphesrv1.epfl.ch">root@lphesrv1.epfl.ch</a>, sock=14<br>11/10/2008 17:01:42;0008;PBS_Server;Job;<a href="http://918.lphesrv1.epfl.ch">918.lphesrv1.epfl.ch</a>;Job Run at request of <a href="mailto:root@lphesrv1.epfl.ch">root@lphesrv1.epfl.ch</a><br>
<br>in the pbs logs.<br><br>I&#39;m using:<br><br>[root@lphesrv1 spool]# qmgr -c &quot;p s&quot;|grep pbs_ver<br>set server pbs_version = 2.3.0-snap.200801151629<br>[root@lphesrv1 spool]# setres -v<br>maui client version 3.2.6p20<br>
<br>Will post my maui.cfg if relevant.<br><br>Thanks,<br><br>Paul.<br><br>-- <br>-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=<br>&nbsp;Paul Szczypka, EPFL SB IPEP LPHE1, BSP 614, CH-1015 Lausanne<br>&nbsp;paul.szczypka@cern.ch&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Tel: +41 21 69 30495<br>
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=<br>&nbsp;&nbsp; Please avoid sending me Word or PowerPoint attachments.<br>&nbsp; See <a href="http://www.gnu.org/philosophy/no-word-attachments.html">http://www.gnu.org/philosophy/no-word-attachments.html</a><br>
<br><br><br>