<div dir="ltr"><div>Thanks Seth<br><br>This command works, i didn&#39;t see it<br><i>/usr/sbin/lsof |/bin/grep ${JOBID}|/bin/awk &#39;{print $2}&#39;|/bin/sort -u<br></i></div><div><i><br><br></i></div></div><div class="gmail_extra">
<br><br><div class="gmail_quote">On Tue, Sep 10, 2013 at 6:32 PM, Seth T Graham <span dir="ltr">&lt;<a href="mailto:sether@fnal.gov" target="_blank">sether@fnal.gov</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
On Sep 10, 2013, at 11:18 AM, Sakhile Masoka &lt;<a href="mailto:sakhile.harvey@gmail.com">sakhile.harvey@gmail.com</a>&gt;<br>
<div class="im"> wrote:<br>
<br>
&gt; I have this command on my epilogue<br>
&gt;<br>
&gt; user_procs=`/bin/ps -e -o pid= -o user= | /bin/grep -e &quot;$2&quot; | \<br>
&gt; while read pid owner.....<br>
&gt;<br>
&gt; which the issue is, if one user is running multiple jobs in one node, my epilogue will kill all of them.<br>
<br>
</div>lsof coupled with a grep gets around this issue. It will only give you process ids that belong to a specific job.<br>
<br>
&gt; I need a way to link JOBID&#39;s ($1) to the processes on the node. But also even with that, processes can start other processes, etc... which will make tracking difficult…<br>
<br>
If you&#39;ve really got a problem with processes spinning up that fast, I don&#39;t think the epilogue is where you want to fix it. I don&#39;t know if my opinion is a common one, but I think the epilogue should only make a single attempt to clean up.. the more magic you try to cram into the prologue/epilogue the more fringe cases you&#39;re going to create, causing jobs to crash (crashed jobs create a heap more tickets than a node being set offline for a while). Policing users should be something you do with cron or a monitoring service. Education can help too.<br>

<div class="HOEnZb"><div class="h5"><br>
_______________________________________________<br>
torqueusers mailing list<br>
<a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
<a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
</div></div></blockquote></div><br></div>