<html><body><div style="color:#000; background-color:#fff; font-family:times new roman, new york, times, serif;font-size:12pt"><div><pre style="font-family: 'times new roman', 'new york', times, serif; font-size: 12pt; ">Hi</pre><pre><font face="'times new roman', 'new york', times, serif" size="4">Although integrating BLCR and Torque already documented but i didn't find a </font><font size="4">reasonable solution for my problems with check pointing.</font></pre><pre><font size="4">when i try to check point a job by qchkpt it seems all things are good but no checkpoint file created.</font></pre><pre><font size="4">I find following error in /var/log/messages</font></pre><pre><font size="4"><br></font></pre><pre><font size="4">Apr 30 11:01:10 node1 checkpoint_script: Invoked: /var/spool/torque/mom_priv/checkpoint_script 7366 1.server root root /var/spool/torque/checkpoint/1.server.CK ckpt.1.server.1335798070 0 -
Apr 30 11:01:10 node1 kernel: blcr: Retry request on -CR_ENOSUPPORT
Apr 30 11:01:10 node1 checkpoint_script: Subcommand (cr_checkpoint --tree 7366 --file ckpt.1.server.1335798070) failed with rc=52:#012- Retry request on -CR_ENOSUPPORT#012Checkpoint failed: support missing from application
Apr 30 11:01:10 node1 pbs_mom: LOG_ERROR::blcr_checkpoint_job, checkpoint script returned value 52
</font></pre><div><font size="4">And here i provide additional information</font></div><div><font size="4">**************PBS Script*******************</font></div><div><font size="4"><div>#!/bin/sh</div><div># Beginning of PBS batch script.</div><div>#PBS -l nodes=1:ppn=4</div><div>##PBS -j oe</div><div>#PBS -o /share/output$JOB_ID.log</div><div>#PBS -e /share/error$JOB_ID.log</div><div>#PBS -N NOTMPI</div><div>#PBS -q batch</div><div>export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib:/usr/lib64<br></div><div>/share/ex2<br></div><div># End of PBS batch script.<br></div><div>**************status of relevant process on node1******************</div></font></div><div><font size="4">#ps -A|grep 7336&nbsp;</font></div><div><font size="4">7366 ? &nbsp; &nbsp; &nbsp; &nbsp;00:00:00 bash</font></div><div><font size="4"><div>#ps -A|grep ex2</div><div>7368 ? &nbsp; &nbsp; &nbsp; &nbsp;00:48:07
 ex2</div><div>***********************************************************</div><div><br></div></font></div><div><font size="4"><br></font></div><div><font size="4">May be it is&nbsp;useful&nbsp;to know that i can check point that running ex2(7368) process by using cr_checkpoint but&nbsp;check pointing&nbsp;bash(7366) process return same error message.</font></div><div><font size="4">Any help is appreciated<br></font></div><div><font size="4">Meysam</font></div><div><font size="4">miralipoor at ipm.ir</font></div></div></div></body></html>