<div dir="ltr"><div><div><div><div>I have this command on my epilogue<br><br><span style="color:rgb(0,0,255)"><i>user_procs=`/bin/ps -e -o pid= -o user= | /bin/grep -e &quot;$2&quot; | \<br>while read pid owner</i></span>.....<br>
<br></div>which the issue is, if one user is running multiple jobs in one node, my epilogue will kill all of them. <br></div>I need a way to link JOBID&#39;s ($1) to the processes on the node. But also even with that, processes can start other processes, etc... which will make tracking difficult... <br>
<br></div>I was under the assumption that moab will assign jobs to the same node if atleast they will end at the same time, or not execute epilogues on that node while other jobs belonging to the same user are still running.<br>
<br></div>I will look at reaver and see what it does.... #hopeful<br><div><div><div><div><div><br></div></div></div></div></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Tue, Sep 10, 2013 at 5:40 PM, Seth T Graham <span dir="ltr">&lt;<a href="mailto:sether@fnal.gov" target="_blank">sether@fnal.gov</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
In our epilogue, we use this command:<br>
<br>
/usr/sbin/lsof |/bin/grep ${JOBID}|/bin/awk &#39;{print $2}&#39;|/bin/sort -u<br>
<br>
Which will list all pids for a job, which you can then feed into a loop to kill them off.<br>
<br>
The JOBID is passed to the epilogue as $1.<br>
<br>
<br>
<br>
On Sep 10, 2013, at 4:02 AM, Sakhile Masoka &lt;<a href="mailto:sakhile.harvey@gmail.com">sakhile.harvey@gmail.com</a>&gt;<br>
<div><div class="h5"> wrote:<br>
<br>
&gt; I have epilogues set on nodes to clean up processes ( stray processes) after a job completes using &quot;userid&quot;. But also I have implemented on Moab, ENFORCENODEACCESS SINGLEUSER, meaning  jobs of the same user can be scheduled to the same node if resources are still available. This helps with users running many single task jobs with less small memory requirements.<br>

&gt;<br>
&gt; The issue now, I have a user saying his jobs (single tasks) are cancelled when one finishes. And I see how that can be, since epilogues will clean all processes on the node that belongs to that user.<br>
&gt;<br>
&gt; Is there a way to work arround this issue, config sugestions etc....<br>
&gt;<br>
&gt; Otherwise I&#39;ll have to disable epilogues and work with prologues alone.<br>
&gt;<br>
&gt; Regards<br>
&gt; Sakhile Masoka<br>
&gt; Sys Admin, CHPC<br>
</div></div>&gt; _______________________________________________<br>
&gt; torqueusers mailing list<br>
&gt; <a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
&gt; <a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
<br>
_______________________________________________<br>
torqueusers mailing list<br>
<a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
<a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
</blockquote></div><br></div>