<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
</head>
<body bgcolor="#ffffff" text="#000000">
<br>
<br>
<a class="moz-txt-link-abbreviated" href="mailto:mauiusers-request@supercluster.org">mauiusers-request@supercluster.org</a> wrote:
<blockquote cite="mid200503031900.j23J04R5015300@supercluster.org"
 type="cite">
  <pre wrap="">


Today's Topics:

   1. What happens when jobs go over their walltime? (Angel de Vicente)


----------------------------------------------------------------------

Message: 1
Date: Thu, 3 Mar 2005 11:58:14 +0000
From: Angel de Vicente <a class="moz-txt-link-rfc2396E" href="mailto:angelv@iac.es">&lt;angelv@iac.es&gt;</a>
Subject: [Mauiusers] What happens when jobs go over their walltime?
To: <a class="moz-txt-link-abbreviated" href="mailto:mauiusers@supercluster.org">mauiusers@supercluster.org</a>
Message-ID: <a class="moz-txt-link-rfc2396E" href="mailto:16934.64470.94675.214413@guinda.iac.es">&lt;16934.64470.94675.214413@guinda.iac.es&gt;</a>
Content-Type: text/plain; charset=us-ascii

Hi,

I've been looking at the parameters for Maui, and I see that there is one called
JOBMAXOVERRUN that almost does what I want... I would like to be able to cancel
a job if it exceeds its walltime by, say, 50%. Can this be done somehow? It
looks unfair to set JOBMAXOVERRUN to a fixed amount. For example 1 hour of
overrun for a 1 week job is almost nothing, but for a 20 minutes one is quite an
overrun.

  </pre>
</blockquote>
<blockquote cite="mid200503031900.j23J04R5015300@supercluster.org"
 type="cite">
  <pre wrap="">And assuming the job is cancelled, what happens to it? In our current
installation of OpenPBS we have a script that goes around the nodes killing the
processes of cancelled jobs. Do we have to write something similar or does the
Maui/Torque combination provide something already?

  </pre>
</blockquote>
The parameter&nbsp; <b>WCVIOLATIONACTION&nbsp; </b>can either preempt the job
(provided your application handles preemption) , or cancel it entirely.<br>
<blockquote cite="mid200503031900.j23J04R5015300@supercluster.org"
 type="cite">
  <pre wrap="">An aside: I also see in the documentation some interesting parameters, like
ENFORCERESOURCELIMITS, SYSTEMDEFAULTJOBWALLTIME or SYSTEMMAXPROCSECONDPERJOB,
but neither "showconfig" or "showconfig -v" show them. How can I know their
values?

  </pre>
</blockquote>
Looking in the documentation, you can see the default values of each
Parameter adjacent to the parameter, ie..<br>
<table nosave="" border="1" width="100%">
  <tbody>
    <tr>
      <td><b>ENFORCERESOURCELIMITS</b></td>
      <td>&lt;BOOLEAN&gt; </td>
      <td>FALSE</td>
    </tr>
  </tbody>
</table>
<br>
As for defaults for queuing resources, we let the server (torque)
handle that.<br>
<br>
Good luck,<br>
<br>
Jerry Smith<br>
---------------------------------<br>
<a class="moz-txt-link-abbreviated" href="mailto:jdsmit@sandia.gov">jdsmit@sandia.gov</a><br>
Infrastructure Computing Systems<br>
Sandia National Laboratories<br>
---------------------------------<br>
<blockquote cite="mid200503031900.j23J04R5015300@supercluster.org"
 type="cite">
  <pre wrap="">Thanks a lot,
Angel de Vicente
  </pre>
</blockquote>
</body>
</html>