<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 12 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:#632423;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal"><span style="color:#632423">Dear Torque development community,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">I&#8217;m trying to troubleshoot a PBS error that I have on a Win32 execute host.&nbsp; I have run into a dead end.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">The symptoms are as follows: after a job is queued to the Torque system, the job is passed to a Win32 execute host and then exits with Exit_status=-1.&nbsp; The PBS mom log on the execute host contains the following
 seven lines as a record of the failure:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">02/20/2012 07:57:02;0001;&nbsp;&nbsp; pbs_mom;Svr;pbs_mom;LOG_ERROR::IamUserByName, WARNING!!! Can`t find user &quot;simuser&quot;!<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">02/20/2012 07:57:02;0001;&nbsp;&nbsp; pbs_mom;Svr;pbs_mom;LOG_ERROR::start_exec, Torque Mom Version = 2.5.4, loglevel = 0<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">02/20/2012 07:57:02;0008;&nbsp;&nbsp; pbs_mom;Req;send_sisters;sending ABORT to sisters for job 2777.hl-vcomputenodemaster.DOMAIN.COMPANYNAME.com<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">02/20/2012 07:57:05;0080;&nbsp;&nbsp; pbs_mom;Svr;preobit_reply;top of preobit_reply<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">02/20/2012 07:57:05;0080;&nbsp;&nbsp; pbs_mom;Svr;preobit_reply;DIS_reply_read/decode_DIS_replySvr worked, top of while loop<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">02/20/2012 07:57:05;0080;&nbsp;&nbsp; pbs_mom;Svr;preobit_reply;in while loop, no error from job stat<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">02/20/2012 07:57:05;0080;&nbsp;&nbsp; pbs_mom;Job;2777.hl-vcomputenodemaster. DOMAIN.COMPANYNAME.com;obit sent to server<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">I suspect that the most interesting information is contained in the first line, following the function name IamUserByName.&nbsp; I have found limited information about this error, and it&#8217;s all contained in the torquedev
 mailing list thread 2173 (<a href="http://www.supercluster.org/pipermail/torquedev/2010-June/002173.html">http://www.supercluster.org/pipermail/torquedev/2010-June/002173.html</a>)<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">To make matters more confusing, this problem only occurs on about 80% of the job submissions; the other 20% are executed normally.&nbsp; Therefore I wonder if there is a reliability issue with the function call IamUserByName.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">Can anyone provide any insight?<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">Thank you,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">Sean Kellogg<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#632423"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="color:#632423">FEI Company<o:p></o:p></span></p>
</div>
</body>
</html>