<div dir="ltr">Andrew,<div><br></div><div>Can you be more specific about what you mean when you say semaphores? </div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Sat, Sep 21, 2013 at 3:09 PM, Andrew Savchenko <span dir="ltr">&lt;<a href="mailto:bircoph@gmail.com" target="_blank">bircoph@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hello,<br>
<br>
is it possible to limit or isolate semaphores per job or user at<br>
worker node in torque?<br>
<br>
At our cluster we have a problem with buggy user jobs which left<br>
semaphores behind leading to semaphore limit exhaustion. While limit<br>
may be lifted, this is not a proper solution since it will be reached<br>
again later. ATM we a running cron job using some heuristics to<br>
determine which semaphores are safe to clear. But this is still<br>
nothing but a workaround.<br>
<br>
The proper way is to isolate job or at least user IPC namespace on<br>
nodes. This can be done using IPC namespace kernel feature, though I<br>
don&#39;t know if torque is capable of this or any other ways to control<br>
job&#39;s IPC.<br>
<br>
ATM we&#39;re using torque-3.0.6, though if 4.x branch is capable of this<br>
feature, it will be a good reason to migrate.<br>
<br>
Best regards,<br>
Andrew Savchenko<br>
<br>_______________________________________________<br>
torqueusers mailing list<br>
<a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
<a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div>David Beer | Senior Software Engineer</div><div>Adaptive Computing</div>
</div>