<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="Generator" CONTENT="MS Exchange Server version 6.0.6556.0">
<TITLE>RMFailure</TITLE>
</HEAD>
<BODY>
<!-- Converted from text/rtf format -->
<BR>

<P><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial">Hi,</FONT></SPAN>
</P>

<P><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial">I am running torque-1.0.1p6 and maui-3.2.6p6.&nbsp; When I stress maui by submitting 25-50 jobs at time, frequently, jobs get stuck in the queues.&nbsp; Maui sees that there are jobs in the queue as detected in the maui.log file, but it never seems to execute them.&nbsp; When performing a &quot;checkjob -v job#&quot; command, I get an RMFailure message as the reason the job cannot be executed.&nbsp; An example of the output of the CHECKJOB command follows.&nbsp; Has anyone seen this problem?&nbsp; Also, how can the job be requeued?&nbsp; The rerun command fails to rerun the job and the status remains the same.</FONT></SPAN></P>

<P><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial">-------------------------------------------------------------------------------------------</FONT></SPAN>
</P>

<P><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial"></FONT>&nbsp;<FONT SIZE=2 FACE="Arial Unicode MS">checking job 153 (RM job '153.resslnxc1-b.res.phar</FONT><FONT SIZE=2 FACE="Arial Unicode MS Western">&#1347;')</FONT></SPAN>
</P>

<P><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">State: Idle&nbsp; EState: Deferred</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">Creds:&nbsp; user:ssamuels&nbsp; group:ssamuels&nbsp; class:test&nbsp; qos:DEFAULT</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">WallTime: 00:00:00 of 99:23:59:59</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">SubmitTime: Wed Sep&nbsp; 1 15:27:25</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">&nbsp; (Time Queued&nbsp; Total: 00:50:14&nbsp; Eligible: 00:00:05)</FONT></SPAN>
</P>

<P><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">StartDate: -00:50:08&nbsp; Wed Sep&nbsp; 1 15:27:31</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">Total Tasks: 1</FONT></SPAN>
</P>

<P><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">Req[0]&nbsp; TaskCount: 1&nbsp; Partition: ALL</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">Network: [NONE]&nbsp; Memory &gt;= 0&nbsp; Disk &gt;= 0&nbsp; Swap &gt;= 0</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">Opsys: [NONE]&nbsp; Arch: [NONE]&nbsp; Features: [NONE]</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">Exec:&nbsp; ''&nbsp; ExecSize: 0&nbsp; ImageSize: 0</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">Dedicated Resources Per Task: PROCS: 1</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">NodeAccess: SHARED</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">NodeCount: 0</FONT></SPAN>
</P>
<BR>

<P><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">IWD: [NONE]&nbsp; Executable:&nbsp; [NONE]</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">Bypass: 0&nbsp; StartCount: 1</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">PartitionMask: [ALL]</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">Flags:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; RESTARTABLE</FONT></SPAN>
</P>

<P><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">job is deferred.&nbsp; Reason:&nbsp; RMFailure&nbsp; (job cannot be started - cannot set hostlist)</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">Holds:&nbsp;&nbsp;&nbsp; Defer&nbsp; (hold reason:&nbsp; RMFailure)</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">PE:&nbsp; 1.00&nbsp; StartPriority:&nbsp; 1</FONT></SPAN>

<BR><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">cannot select job 153 for partition DEFAULT (job hold active)</FONT></SPAN>
</P>

<P><SPAN LANG="en-us"><FONT SIZE=2 FACE="Arial Unicode MS">============================================================================</FONT></SPAN>
</P>

<P><SPAN LANG="en-us"><B><I><FONT FACE="Script MT Bold"></FONT></I>&nbsp;<FONT FACE="Script MT Bold">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<U> </U></FONT><U><FONT COLOR="#0000FF" FACE="Script MT Bold">Stewart Samuels</FONT></U></B></SPAN>

<BR><SPAN LANG="en-us"><B><FONT FACE="Script MT Bold">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Technical Advisor</FONT></B></SPAN>

<BR><SPAN LANG="en-us"><B><FONT FACE="Script MT Bold">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Global Unix Engineering Services&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</FONT></B> <FONT SIZE=2 FACE="Arial">&nbsp;&nbsp;</FONT><B></B><B></B><B> </B></SPAN>

<BR><SPAN LANG="en-us"><B>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <FONT FACE="Script MT Bold">&nbsp;&nbsp; 1041 Route 202-206&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; </FONT></B></SPAN>

<BR><SPAN LANG="en-us"><B><FONT FACE="Script MT Bold">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Bridgewater, NJ&nbsp; 08807</FONT></B></SPAN>
</P>

<P><SPAN LANG="en-us"><B><FONT FACE="Script MT Bold">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; </FONT><FONT COLOR="#0000FF" FACE="Script MT Bold">(908) 231-4762</FONT></B></SPAN>

<BR><SPAN LANG="en-us"><B><FONT COLOR="#0000FF" FACE="Script MT Bold">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Stewart.Samuels@Aventis.com</FONT></B></SPAN>
</P>

</BODY>
</HTML>