<br><br><div class="gmail_quote">On Thu, Mar 21, 2013 at 10:26 AM, Joerg Blank <span dir="ltr">&lt;<a href="mailto:j.blank@fz-juelich.de" target="_blank">j.blank@fz-juelich.de</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hello everyone,<br>
<br>
we are currently still experiencing 0-10 crashes per day from two causes:<br>
<br>
1.) There is a double free in the handling of attrlists.<br></blockquote><div><br></div><div>I have logged an internal ticket at adaptive for this issue. Can you create an issue on GitHub?</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

2.) It seems that sometimes information about the mywork variable in<br>
work_thread (u_threadpool.c) gets corrupted, which leads to a subsequent<br>
crash on the free call, when closing down a thread. I suspect the thread<br>
shutdown has to be guarded by a mutex.<br></blockquote><div><br></div><div>Do you have a core file or at least a backtrace for this issue? </div><div><br></div><div>David</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<br>
Regards,<br>
Jörg Blank<br>
<br>
<br>
#0  0x00007f44d3e34b23 in<br>
tcmalloc::ThreadCache::ReleaseToCentralCache(tcmalloc::ThreadCache::FreeList*,<br>
unsigned long, int) () from /usr/lib/libtcmalloc.so<br>
(gdb) bt<br>
#0  0x00007f44d3e34b23 in<br>
tcmalloc::ThreadCache::ReleaseToCentralCache(tcmalloc::ThreadCache::FreeList*,<br>
unsigned long, int) () from /usr/lib/libtcmalloc.so<br>
#1  0x00007f44d3e34f67 in tcmalloc::ThreadCache::Scavenge() () from<br>
/usr/lib/libtcmalloc.so<br>
#2  0x00007f44d3e41685 in tc_free () from /usr/lib/libtcmalloc.so<br>
#3  0x000000000046ef6c in free_attrlist (pattrlisthead=0xaa2df38) at<br>
attr_func.c:422<br>
#4  0x0000000000431542 in reply_free (prep=0x8802e88) at reply_send.c:300<br>
#5  0x000000000042f269 in free_br (preq=0x8802a00) at process_request.c:1080<br>
#6  0x0000000000431378 in reply_send_svr (request=0x8802a00) at<br>
reply_send.c:197<br>
#7  0x00000000004504a4 in sel_step3 (cntl=0xb1e0d80) at req_select.c:670<br>
#8  0x000000000044fbe7 in req_selectjobs (preq=0x8802a00) at<br>
req_select.c:351<br>
#9  0x000000000042ee51 in dispatch_request (sfds=7, request=0x8802a00)<br>
at process_request.c:869<br>
#10 0x000000000042e942 in process_request (chan=0x7a48ba0) at<br>
process_request.c:662<br>
#11 0x0000000000429f54 in process_pbs_server_port (sock=7,<br>
is_scheduler_port=0) at pbsd_main.c:402<br>
#12 0x000000000042a1b3 in start_process_pbs_server_port<br>
(new_sock=0x6a1fbc0) at pbsd_main.c:533<br>
#13 0x000000000047373e in work_thread (a=0x7fff7d872480) at<br>
u_threadpool.c:307<br>
#14 0x00007f44d29e48ca in start_thread (arg=&lt;value optimized out&gt;) at<br>
pthread_create.c:300<br>
#15 0x00007f44d2543b6d in clone () at<br>
../sysdeps/unix/sysv/linux/x86_64/clone.S:112<br>
#16 0x0000000000000000 in ?? ()<br>
<br>
<br>
_______________________________________________<br>
torqueusers mailing list<br>
<a href="mailto:torqueusers@supercluster.org">torqueusers@supercluster.org</a><br>
<a href="http://www.supercluster.org/mailman/listinfo/torqueusers" target="_blank">http://www.supercluster.org/mailman/listinfo/torqueusers</a><br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br><div>David Beer | Senior Software Engineer</div><div>Adaptive Computing</div>