<html><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div><div>On 9-Jun-08, at 14:02 , Kamil Kisiel wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div>Occasionally some of our cluster nodes send out a syslog message such as:<br><br>node071.cluster.zymeworks.com pbs_mom: No such process (3) in resi_sum, 797: get_proc_stat<br><br>The number after "resi_sum" is different in each message, presumably it's the PID of some process.<br><br>What does this mean, and what could be causing it?<br></div></blockquote></div><br><div>So far I haven't had any reply to this. Nobody has any clue?<br><br>I also noticed that jobs run through MPI are under-reporting the cputime used in qstat output. Is that related, or a separate issue?<br><br><br>____________<br>Kamil Kisiel<br>HPC Systems Engineer, Zymeworks Inc.<br>201-1401 West Broadway,<br>Vancouver, BC, V6H 1H6, Canada<br>Tel: (604) 678-1388 ext. 135<br>Fax: (604) 737-7077<br><a href="http://www.zymeworks.com/">www.zymeworks.com</a></div>
<br>

Notice of Confidentiality: The information transmitted is intended only for the
person or entity to which it is addressed and may contain confidential and/or
privileged material. Any review, re-transmission, dissemination or other use of
or taking of any action in reliance upon this information by persons or entities
other than the intended recipient is prohibited. If you received this in error
please contact the sender immediately by return electronic transmission and then
immediately delete this transmission including all attachments without copying,
distributing or disclosing the same.



<br></body></html>