<html><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">
Hi,<div><span class="Apple-tab-span" style="white-space:pre">        </span>I've wondered this but haven't had to do it much. Looking at the man page for pbs_mom I see:</div><div><br></div><div><div>-p              Specifies  the  impact  on  jobs  which  were in execution when the mini-server shut down.  On any</div><div>                       restart of MOM, the new mini-server will not be the parent of any running jobs, MOM has lost  con-</div><div>                       trol  of her offspring (not a new situation for a mother).  With the -p option, Mom will allow the</div><div>                       jobs to continue to run and monitor them indirectly via polling.  The -p option is mutually exclu-</div><div>                       sive with the -r option.</div><div><br></div><div>would this do it? And I assume this means the pbs_mom would be the parent for new jobs coming to the node?  </div><div><br></div><div>-Steve</div><div><br></div><div><div>On Jun 24, 2008, at 10:38 AM, Rob Lines wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite">We need to restart the pbs_mom to implement the fix found here <a href="http://www.clusterresources.com/pipermail/torqueusers/2007-March/005360.html">http://www.clusterresources.com/pipermail/torqueusers/2007-March/005360.html</a>.  We have never restarted the pbs_mom process while there were jobs running on a node (atleast ones that we cared about keeping) so I am wondering what the results would be of restarting them on machines with active jobs.  We have restarted the maui process before with no problem but its' part in the process is different.<br> <br>We had the backup plan of just draining all the nodes then restarting pbs_mom on any of them that don't have jobs currently then putting those nodes back in service then once the other nodes that have current jobs finish we would restart their pbs_mom and put them back in service.  I had just hoped to avoid that because it would mean I have to pay attention to the them and some of the jobs that are running currently are multi day runs.<br> <br>Thanks for the help,<br>Rob<br><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">_______________________________________________</div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">torqueusers mailing list</div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; "><a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a></div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; "><a href="http://www.supercluster.org/mailman/listinfo/torqueusers">http://www.supercluster.org/mailman/listinfo/torqueusers</a></div> </blockquote></div><br></div></body></html>