<div dir="ltr">It appears that this is a bug that crept into the 2.5 source. Martin is correct that this change should simply be reverted to fix the bug.<div><br></div><div>David</div></div><div class="gmail_extra"><br><br>
<div class="gmail_quote">On Tue, Oct 22, 2013 at 3:51 PM, Martin Siegert <span dir="ltr">&lt;<a href="mailto:siegert@sfu.ca" target="_blank">siegert@sfu.ca</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="HOEnZb"><div class="h5">On Tue, Oct 22, 2013 at 02:27:35PM -0700, Martin Siegert wrote:<br>
&gt; On Tue, Oct 22, 2013 at 11:06:41PM +0200, Burkhard Bunk wrote:<br>
&gt; &gt; Hi,<br>
&gt; &gt;<br>
&gt; &gt; with your findings in mind, I checked my installations. I didn&#39;t use<br>
&gt; &gt; accounting so far, but scanning through the accounting files, I can<br>
&gt; &gt; confirm your observation.<br>
&gt; &gt;<br>
&gt; &gt; My installations used 2.5.11 until July 2013, when I pulled 2.5.13 from<br>
&gt; &gt; git and rebuilt my packages. After the update, the accounting records<br>
&gt; &gt; don&#39;t contain &quot;resources_used&quot; clauses anymore.<br>
&gt; &gt;<br>
&gt; &gt; My distribution is Debian 7 by now (32 and 64 bit), but an older server<br>
&gt; &gt; is still on Debian 6 (32 bit), all with the same symptoms.<br>
&gt; &gt;<br>
&gt; &gt; Regards,<br>
&gt; &gt; Burkhard Bunk.<br>
&gt; &gt; ----------------------------------------------------------------------<br>
&gt; &gt;   <a href="mailto:bunk@physik.hu-berlin.de">bunk@physik.hu-berlin.de</a>      Physics Institute, Humboldt University<br>
&gt; &gt;   fax:    <a href="tel:%2B%2B49-30%202093%207628" value="+493020937628">++49-30 2093 7628</a>     Newtonstr. 15<br>
&gt; &gt;   phone:  <a href="tel:%2B%2B49-30%202093%207980" value="+493020937980">++49-30 2093 7980</a>     12489 Berlin, Germany<br>
&gt; &gt; ----------------------------------------------------------------------<br>
&gt; &gt;<br>
&gt; &gt; On Tue, 22 Oct 2013, Grigory Shamov wrote:<br>
&gt; &gt;<br>
&gt; &gt; &gt; Hi,<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; For some reason , our Torque 2.5 stopped reporting the used resources in $SERVER_PRIV/accounting . It has now, for the finished jobs, something like this:<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; 10/09/2013 23:59:53;E;YYYYYYY;user=XXX group=fazioja jobname=NAME_pseudo queue=default ctime=1381327807 qtime=1381327807 etime=1381327807 start=1381360466 owner=XXX@ZZZ exec_host=n181/11 Resource_List.mem=20gb Resource_List.opsys=RHEL6 Resource_List.pmem=256mb Resource_List.procs=1 Resource_List.walltime=80:00:00 session=30801 end=1381381193 Exit_status=0<br>

&gt; &gt; &gt;<br>
&gt; &gt; &gt; The only change I can recollect was updating from 2.5.12 to 2.5.13 to address the vulnerability and mom_segfaults issues. I have built it with exactly same configure parameters (but on different CentOS version, 6 instead of 5) as before.<br>

&gt; &gt; &gt;<br>
&gt; &gt; &gt; Before I have updated it, there were things like &quot;resources_used.cput=00:05:40 resources_used.mem=232748kb resources_used.vmem=10462620kb resources_used.walltime=00:01:10&quot; right after the Exit_status field. Now they disappeared.<br>

&gt; &gt; &gt;<br>
&gt; &gt; &gt; Did anything changed between 2.5.12 and 2.5.13 that could cause it? Or, is there a setting that I could trip accidentally, or something like that? Does anyone run Torque 2.5.13, if yes, do you have the complete accounting strings?<br>

&gt;<br>
&gt; I suspect that the following change is responsible:<br>
&gt;<br>
&gt; # diff -u torque-2.5.12/src/server/req_jobobit.c torque-2.5.13/src/server/req_jobobit.c<br>
&gt; --- torque-2.5.12/src/server/req_jobobit.c      2011-10-05 16:20:11.000000000 -0700<br>
&gt; +++ torque-2.5.13/src/server/req_jobobit.c      2013-08-01 09:10:01.000000000 -0700<br>
&gt; @@ -2237,7 +2237,9 @@<br>
&gt;    char   acctbuf[RESC_USED_BUF];<br>
&gt;    int    accttail;<br>
&gt;    int    exitstatus;<br>
&gt; +#ifdef USESAVEDRESOURCES<br>
&gt;    int    have_resc_used = FALSE;<br>
&gt; +#endif<br>
&gt;    char   mailbuf[RESC_USED_BUF];<br>
&gt;    int    newstate;<br>
&gt;    int    newsubst;<br>
&gt; @@ -2399,10 +2401,10 @@<br>
&gt;<br>
&gt;    accttail = strlen(acctbuf);<br>
&gt;<br>
&gt; -  have_resc_used = get_used(patlist, acctbuf);<br>
&gt;<br>
&gt;  #ifdef USESAVEDRESOURCES<br>
&gt;<br>
&gt; +  have_resc_used = get_used(patlist, acctbuf);<br>
&gt;    /* if we don&#39;t have resources from the obit, use what the job already had */<br>
&gt;<br>
&gt;    if (!have_resc_used)<br>
&gt;<br>
&gt; I am guessing that that the flag -DUSESAVEDRESOURCES is missing, but<br>
&gt; necessary with torque-2.5.13.<br>
<br>
</div></div>I just looked at the torque-4.2.5 code and that code corresponds to the<br>
torque-2.5.12/src/server/req_jobobit.c version. Thus, I would simply revert<br>
the change, i.e., copy the torque-2.5.12/src/server/req_jobobit.c to<br>
torque 2.5.13/src/server/req_jobobit.c and recompile.<br>
<div class="HOEnZb"><div class="h5"><br>
Cheers,<br>
Martin<br>
_______________________________________________<br>
torqueusers mailing list<br>
<a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
<a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
</div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br><div>David Beer | Senior Software Engineer</div><div>Adaptive Computing</div>
</div>