I second this feature<div><br></div><div><br></div><div>Regards,</div><div>Marvin</div><div><br><br><div class="gmail_quote">On Fri, Jun 25, 2010 at 10:58 PM, Danny Sternkopf <span dir="ltr">&lt;<a href="mailto:dsternkopf@hpce.nec.com">dsternkopf@hpce.nec.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Hi,<br>
<br>
any news about this? I have the following setup:<br>
o torque 2.4.8<br>
o openmpi 1.4.2<br>
o blcr 0.8.2<br>
<br>
The checkpoint/restart scripts from Torque&#39;s contrib/blcr work for<br>
single node application without MPI. I created new scripts for OpenMPI<br>
applications. The checkpoint works, but the release does not. The issue<br>
might be that ompi-checkpoint writes a directory including checkpoint<br>
files for each process plus metadata and Torque expects one single<br>
checkpoint file. Any experiences?<br>
<br>
Btw another issue is that the checkpoint/restart scripts run as root.<br>
ompi-checkpoint doesn&#39;t allow that root can checkpoint user jobs. So you<br>
have to run the ompi-checkpoint as user. The restart script of course<br>
needs this as well to restart process under the corresponding user id.<br>
<br>
Furthermore any comments to handle MPI and single process applications<br>
with same checkpoint/restart scripts?<br>
<br>
Regards,<br>
<font color="#888888"><br>
Danny<br>
</font><div class="im">On 3/13/2010 8:39 AM, Chris Samuel wrote:<br>
&gt; On Tue, 23 Feb 2010 09:15:27 pm Anton Starikov wrote:<br>
&gt;<br>
&gt;&gt; Can anyone provide example of checkpoint script for torque which deals with<br>
&gt;&gt; open-mpi checkpointing?<br>
&gt;<br>
&gt; I too would be very interested in this - I am pondering trying BLCR on our new<br>
&gt; clusters at VLSCI..<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
</div><div><div></div><div class="h5">&gt; _______________________________________________<br>
&gt; torqueusers mailing list<br>
&gt; <a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
&gt; <a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
_______________________________________________<br>
torqueusers mailing list<br>
<a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
<a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
</div></div></blockquote></div><br></div>