Hello All,<br>I am testing blcr with torque.  It works to an extent when i follow the instructions.<br><br>qhold jobid creates a checkpoing file in /var/spool/torque/checkpoint/joibid.CK/ckpt.182025.somerandomnumer<br><br>
When i do a qrls $JOBID job goes to a W state as it failed to retrieve the ckpt file. After checking the logs it appears<br>that the .somerandomnumer with which the checkpoint file is created is differnt from the file mom is trying to copy.<br>
I could not find info on this as to how the random number is selected and why it changes from the time the file is created to the time when it is restarted.<br><br>Any clues.<br><br>Bhavs<br>