<div dir="ltr">Hi,<br>we have a some large job, and we allocate 8 nodes(2 cpus in one node) for it.But the following message is output and can not continue to process:<br>rm_l_4_4085:&nbsp; p4_error: interrupt SIGx: 15<br>rm_l_4_4085: (93.277344) net_send: could not write to fd=5, errno = 32<br>
p7_4529: (95.332031) net_recv failed for fd = 11<br>p7_4529:&nbsp; p4_error: net_recv read, errno = : 104<br>rm_l_7_4531: (95.378906) net_send: could not write to fd=5, errno = 32<br>rm_l_5_4086:&nbsp; p4_error: interrupt SIGx: 15<br>
rm_l_5_4086: (94.468750) net_send: could not write to fd=5, errno = 32<br>rm_l_6_4530:&nbsp; p4_error: interrupt SIGx: 15<br>rm_l_6_4530: (95.402344) net_send: could not write to fd=5, errno = 32<br>bm_list_13428:&nbsp; p4_error: interrupt SIGx: 15<br>
p7_4529: (100.253906) net_send: could not write to fd=5, errno = 32<br>rm_l_3_23909:&nbsp; p4_error: interrupt SIGx: 13<br>rm_l_2_23908:&nbsp; p4_error: interrupt SIGx: 13<br>rm_l_3_23909: (103.335938) net_send: could not write to fd=5, errno = 32<br>
rm_l_3_23909: (103.339844) net_send: could not write to fd=7, errno = 32<br>rm_l_3_23909: (103.339844) net_send: could not write to fd=8, errno = 32<br>rm_l_3_23909: (103.339844) net_send: could not write to fd=9, errno = 32<br>
rm_l_3_23909: (103.339844) net_send: could not write to fd=10, errno = 32<br>rm_l_3_23909: (103.339844) net_send: could not write to fd=11, errno = 32<br>rm_l_3_23909: (103.339844) net_send: could not write to fd=12, errno = 32<br>
rm_l_3_23909: (103.339844) net_send: could not write to fd=13, errno = 32<br>rm_l_3_23909: (103.339844) net_send: could not write to fd=5, errno = 32<br><br>what should i do?<br>Thanks<br>-- <br>Best Wishes<br>ChenWeiguang<br>

</div>