Hi,<div><br></div><div>I was configuring torque on a 100-server cluster.</div><div>I was wondering how common of a practice is it to configure a PBS_MOM to use a health-check script ? </div><div>How does one ensure that the health-check script covers all eventualities ? </div>
<div>Can you give me advice help regarding what are the most common types of failures that the health-check script usually detects ?</div><div><br></div><div>Thanks a lot,</div><div>Arka.</div><div><br></div><div><br></div>