Sorry, did reply to Chris only.<br><br><div class="gmail_quote">On Sat, Jan 30, 2010 at 11:22 AM, Chris Samuel <span dir="ltr">&lt;<a href="mailto:chris@csamuel.org">chris@csamuel.org</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="im">On Fri, 29 Jan 2010 01:05:27 am Arnau Bria wrote:<br>
<br>
&gt; But is someone really doing reboot via torque? What are your steps when<br>
&gt; you need to reboot your farm?<br>
<br>
</div>At VPAC we did this through having a system user who would get a priority<br>
boost via Moab&#39;s config which would submit jobs asking for<br>
nodes=tango001:ppn=8 (for example) and then doing &quot;sudo reboot&quot; for instance.<br>
<br>
Usually though we use our health check scripts to spot things like an out of<br>
date kernel on the node and then it marks itself offline for manual<br>
intervention.<br>
<br>
cheers,<br>
Chris<br>
<font color="#888888">--<br>
 Chris Samuel  :  <a href="http://www.csamuel.org/" target="_blank">http://www.csamuel.org/</a>  :  Melbourne, VIC<br>
<br>
This email may come with a PGP signature as a file. Do not panic.<br>
For more info see: <a href="http://en.wikipedia.org/wiki/OpenPGP" target="_blank">http://en.wikipedia.org/wiki/OpenPGP</a><br>
</font><br>_______________________________________________<br>
torqueusers mailing list<br>
<a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
<a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
<br></blockquote></div><br>