<div dir="ltr">







<p class="">2.17-106.el7 is the latest glibc on CentOS 7. Tried the one-liner on older versions as well which also results in &quot;likely buggy&quot; according to the test.</p><p class="">Found this CentOS issue - <a href="https://bugs.centos.org/view.php?id=10426">https://bugs.centos.org/view.php?id=10426</a></p><p class=""># rpm -qa | grep glibc<br><span class=""><b>glibc</b></span><span class="">-2.17-106.el7_2.4.x86_64<br></span><span class=""><b>glibc</b></span><span class="">-common-2.17-106.el7_2.4.x86_64</span></p><p class=""><span class=""># objdump -r -d /lib64/libc.so.6 | grep -C 20 _int_free | grep -C 10 cmpxchg | head -21 | grep -A 3 cmpxchg | tail -1 | (grep &#39;%r&#39; &amp;&amp; echo &quot;Your libc is likely buggy.&quot; || echo &quot;Your libc looks OK.&quot;)<br></span><span class="">   7ca3e:<span class="">        </span>48 85 c9             <span class="">        </span>test   </span><span class=""><b>%r</b></span><span class="">cx,</span><span class=""><b>%r</b></span><span class="">cx<br></span>Your libc is likely buggy.</p><p class="">Kind regards,<br>Fredrik Widlund</p></div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Feb 23, 2016 at 4:27 PM, Raghavendra Gowdappa <span dir="ltr">&lt;<a href="mailto:rgowdapp@redhat.com" target="_blank">rgowdapp@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Came across a glibc bug which could&#39;ve caused some corruptions. On googling about possible problems, we found that there is an issue (<a href="https://bugzilla.redhat.com/show_bug.cgi?id=1305406" rel="noreferrer" target="_blank">https://bugzilla.redhat.com/show_bug.cgi?id=1305406</a>) fixed in glibc-2.17-121.el7. From the bug we found the following test-script to determine if the glibc is buggy. And on running it, we ran it on the local setup using the following method given in the bug:<br>
<br>
----------------<br>
# objdump -r -d /lib64/libc.so.6 | grep -C 20 _int_free | grep -C 10 cmpxchg | head -21 | grep -A 3 cmpxchg | tail -1 | (grep &#39;%r&#39; &amp;&amp; echo &quot;Your libc is likely buggy.&quot; || echo &quot;Your libc looks OK.&quot;)<br>
<br>
   7cc36:    48 85 c9                 test   %rcx,%rcx<br>
Your libc is likely buggy.<br>
----------------<br>
<br>
Could you check if the above command on your setup gives the same output which says &quot;Your libc is likely buggy.&quot;<br>
<br>
Thanks to Nithya, Krutika and Pranith for working on this.<br>
<span class="im HOEnZb"><br>
----- Original Message -----<br>
&gt; From: &quot;Fredrik Widlund&quot; &lt;<a href="mailto:fredrik.widlund@gmail.com">fredrik.widlund@gmail.com</a>&gt;<br>
&gt; To: <a href="mailto:gluster@deej.net">gluster@deej.net</a><br>
&gt; Cc: <a href="mailto:gluster-users@gluster.org">gluster-users@gluster.org</a><br>
&gt; Sent: Tuesday, February 23, 2016 5:51:37 PM<br>
</span><span class="im HOEnZb">&gt; Subject: Re: [Gluster-users] glusterfs client crashes<br>
&gt;<br>
</span><div class="HOEnZb"><div class="h5">&gt; Hi,<br>
&gt;<br>
&gt; I have experienced what looks like a very similar crash. Gluster 3.7.6 on<br>
&gt; CentOS 7. No errors on the bricks or on other at the time mounted clients.<br>
&gt; Relatively high load at the time.<br>
&gt;<br>
&gt; Remounting the filesystem brought it back online.<br>
&gt;<br>
&gt;<br>
&gt; pending frames:<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(STAT)<br>
&gt; frame : type(1) op(STAT)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(1) op(READ)<br>
&gt; frame : type(0) op(0)<br>
&gt; patchset: git:// <a href="http://git.gluster.com/glusterfs.git" rel="noreferrer" target="_blank">git.gluster.com/glusterfs.git</a><br>
&gt; signal received: 6<br>
&gt; time of crash:<br>
&gt; 2016-02-22 10:28:45<br>
&gt; configuration details:<br>
&gt; argp 1<br>
&gt; backtrace 1<br>
&gt; dlfcn 1<br>
&gt; libpthread 1<br>
&gt; llistxattr 1<br>
&gt; setfsid 1<br>
&gt; spinlock 1<br>
&gt; epoll.h 1<br>
&gt; xattr.h 1<br>
&gt; st_atim.tv_nsec 1<br>
&gt; package-string: glusterfs 3.7.6<br>
&gt; /lib64/libglusterfs.so.0(_gf_msg_backtrace_nomem+0xc2)[0x7f83387f7012]<br>
&gt; /lib64/libglusterfs.so.0(gf_print_trace+0x31d)[0x7f83388134dd]<br>
&gt; /lib64/libc.so.6(+0x35670)[0x7f8336ee5670]<br>
&gt; /lib64/libc.so.6(gsignal+0x37)[0x7f8336ee55f7]<br>
&gt; /lib64/libc.so.6(abort+0x148)[0x7f8336ee6ce8]<br>
&gt; /lib64/libc.so.6(+0x75317)[0x7f8336f25317]<br>
&gt; /lib64/libc.so.6(+0x7cfe1)[0x7f8336f2cfe1]<br>
&gt; /lib64/libglusterfs.so.0(loc_wipe+0x27)[0x7f83387f4d47]<br>
&gt; /usr/lib64/glusterfs/3.7.6/xlator/performance/md-cache.so(mdc_local_wipe+0x11)[0x7f8329c8e5f1]<br>
&gt; /usr/lib64/glusterfs/3.7.6/xlator/performance/md-cache.so(mdc_stat_cbk+0x10c)[0x7f8329c8f4fc]<br>
&gt; /lib64/libglusterfs.so.0(default_stat_cbk+0xac)[0x7f83387fcc5c]<br>
&gt; /usr/lib64/glusterfs/3.7.6/xlator/cluster/distribute.so(dht_file_attr_cbk+0x149)[0x7f832ab2a409]<br>
&gt; /usr/lib64/glusterfs/3.7.6/xlator/protocol/client.so(client3_3_stat_cbk+0x3c6)[0x7f832ad6d266]<br>
&gt; /lib64/libgfrpc.so.0(rpc_clnt_handle_reply+0x90)[0x7f83385c5b80]<br>
&gt; /lib64/libgfrpc.so.0(rpc_clnt_notify+0x1bf)[0x7f83385c5e3f]<br>
&gt; /lib64/libgfrpc.so.0(rpc_transport_notify+0x23)[0x7f83385c1983]<br>
&gt; /usr/lib64/glusterfs/3.7.6/rpc-transport/socket.so(+0x9506)[0x7f832d261506]<br>
&gt; /usr/lib64/glusterfs/3.7.6/rpc-transport/socket.so(+0xc3f4)[0x7f832d2643f4]<br>
&gt; /lib64/libglusterfs.so.0(+0x878ea)[0x7f83388588ea]<br>
&gt; /lib64/libpthread.so.0(+0x7dc5)[0x7f833765fdc5]<br>
&gt; /lib64/libc.so.6(clone+0x6d)[0x7f8336fa621d]<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Kind regards,<br>
&gt; Fredrik Widlund<br>
&gt;<br>
&gt; On Tue, Feb 23, 2016 at 1:00 PM, &lt; <a href="mailto:gluster-users-request@gluster.org">gluster-users-request@gluster.org</a> &gt; wrote:<br>
&gt;<br>
&gt;<br>
&gt; Date: Mon, 22 Feb 2016 15:08:47 -0500<br>
&gt; From: Dj Merrill &lt; <a href="mailto:gluster@deej.net">gluster@deej.net</a> &gt;<br>
&gt; To: Gaurav Garg &lt; <a href="mailto:ggarg@redhat.com">ggarg@redhat.com</a> &gt;<br>
&gt; Cc: <a href="mailto:gluster-users@gluster.org">gluster-users@gluster.org</a><br>
&gt; Subject: Re: [Gluster-users] glusterfs client crashes<br>
&gt; Message-ID: &lt; <a href="mailto:56CB6ACF.5080408@deej.net">56CB6ACF.5080408@deej.net</a> &gt;<br>
&gt; Content-Type: text/plain; charset=utf-8; format=flowed<br>
&gt;<br>
&gt; On 2/21/2016 2:23 PM, Dj Merrill wrote:<br>
&gt; &gt; Very interesting. They were reporting both bricks offline, but the<br>
&gt; &gt; processes on both servers were still running. Restarting glusterfsd on<br>
&gt; &gt; one of the servers brought them both back online.<br>
&gt;<br>
&gt; I realize I wasn&#39;t clear in my comments yesterday and would like to<br>
&gt; elaborate on this a bit further. The &quot;very interesting&quot; comment was<br>
&gt; sparked because when we were running 3.7.6, the bricks were not<br>
&gt; reporting as offline when a client was having an issue, so this is new<br>
&gt; behaviour now that we are running 3.7.8 (or a different issue entirely).<br>
&gt;<br>
&gt; The other point that I was not clear on is that we may have one client<br>
&gt; reporting the &quot;Transport endpoint is not connected&quot; error, but the other<br>
&gt; 40+ clients all continue to work properly. This is the case with both<br>
&gt; 3.7.6 and 3.7.8.<br>
&gt;<br>
&gt; Curious, how can the other clients continue to work fine if both Gluster<br>
&gt; 3.7.8 servers are reporting the bricks as offline?<br>
&gt;<br>
&gt; What does &quot;offline&quot; mean in this context?<br>
&gt;<br>
&gt;<br>
&gt; Re: the server logs, here is what I&#39;ve found so far listed on both<br>
&gt; gluster servers (glusterfs1 and glusterfs2):<br>
&gt;<br>
&gt; [2016-02-21 08:06:02.785788] I [glusterfsd-mgmt.c:1596:mgmt_getspec_cbk]<br>
&gt; 0-glusterfs: No change in volfile, continuing<br>
&gt; [2016-02-21 18:48:20.677010] W [socket.c:588:__socket_rwv]<br>
&gt; 0-gv0-client-1: readv on (sanitized IP of glusterfs2):49152 failed (No<br>
&gt; data available)<br>
&gt; [2016-02-21 18:48:20.677096] I [MSGID: 114018]<br>
&gt; [client.c:2030:client_rpc_notify] 0-gv0-client-1: disconnected from<br>
&gt; gv0-client-1. Client process will keep trying to connect to glusterd<br>
&gt; until brick&#39;s port is available<br>
&gt; [2016-02-21 18:48:31.148564] E [MSGID: 114058]<br>
&gt; [client-handshake.c:1524:client_query_portmap_cbk] 0-gv0-client-1:<br>
&gt; failed to get the port number for remote subvolume. Please run &#39;gluster<br>
&gt; volume status&#39; on server to see if brick process is running.<br>
&gt; [2016-02-21 18:48:40.941715] W [socket.c:588:__socket_rwv] 0-glusterfs:<br>
&gt; readv on (sanitized IP of glusterfs2):24007 failed (No data available)<br>
&gt; [2016-02-21 18:48:51.184424] I [glusterfsd-mgmt.c:1596:mgmt_getspec_cbk]<br>
&gt; 0-glusterfs: No change in volfile, continuing<br>
&gt; [2016-02-21 18:48:51.972068] I [glusterfsd-mgmt.c:58:mgmt_cbk_spec]<br>
&gt; 0-mgmt: Volume file changed<br>
&gt; [2016-02-21 18:48:51.980210] I [glusterfsd-mgmt.c:58:mgmt_cbk_spec]<br>
&gt; 0-mgmt: Volume file changed<br>
&gt; [2016-02-21 18:48:51.985211] I [glusterfsd-mgmt.c:58:mgmt_cbk_spec]<br>
&gt; 0-mgmt: Volume file changed<br>
&gt; [2016-02-21 18:48:51.995002] I [glusterfsd-mgmt.c:58:mgmt_cbk_spec]<br>
&gt; 0-mgmt: Volume file changed<br>
&gt; [2016-02-21 18:48:53.006079] I [glusterfsd-mgmt.c:1596:mgmt_getspec_cbk]<br>
&gt; 0-glusterfs: No change in volfile, continuing<br>
&gt; [2016-02-21 18:48:53.018104] I [glusterfsd-mgmt.c:1596:mgmt_getspec_cbk]<br>
&gt; 0-glusterfs: No change in volfile, continuing<br>
&gt; [2016-02-21 18:48:53.024060] I [glusterfsd-mgmt.c:1596:mgmt_getspec_cbk]<br>
&gt; 0-glusterfs: No change in volfile, continuing<br>
&gt; [2016-02-21 18:48:53.035170] I [glusterfsd-mgmt.c:1596:mgmt_getspec_cbk]<br>
&gt; 0-glusterfs: No change in volfile, continuing<br>
&gt; [2016-02-21 18:48:53.045637] I [rpc-clnt.c:1847:rpc_clnt_reconfig]<br>
&gt; 0-gv0-client-1: changing port to 49152 (from 0)<br>
&gt; [2016-02-21 18:48:53.051991] I [MSGID: 114057]<br>
&gt; [client-handshake.c:1437:select_server_supported_programs]<br>
&gt; 0-gv0-client-1: Using Program GlusterFS 3.3, Num (1298437), Version (330)<br>
&gt; [2016-02-21 18:48:53.052439] I [MSGID: 114046]<br>
&gt; [client-handshake.c:1213:client_setvolume_cbk] 0-gv0-client-1: Connected<br>
&gt; to gv0-client-1, attached to remote volume &#39;/export/brick1/sdb1&#39;.<br>
&gt; [2016-02-21 18:48:53.052486] I [MSGID: 114047]<br>
&gt; [client-handshake.c:1224:client_setvolume_cbk] 0-gv0-client-1: Server<br>
&gt; and Client lk-version numbers are not same, reopening the fds<br>
&gt; [2016-02-21 18:48:53.052668] I [MSGID: 114035]<br>
&gt; [client-handshake.c:193:client_set_lk_version_cbk] 0-gv0-client-1:<br>
&gt; Server lk version = 1<br>
&gt; [2016-02-21 18:48:31.148706] I [MSGID: 114018]<br>
&gt; [client.c:2030:client_rpc_notify] 0-gv0-client-1: disconnected from<br>
&gt; gv0-client-1. Client process will keep trying to connect to glusterd<br>
&gt; until brick&#39;s port is available<br>
&gt; [2016-02-21 18:49:12.271865] W [socket.c:588:__socket_rwv] 0-glusterfs:<br>
&gt; readv on (sanitized IP of glusterfs2):24007 failed (No data available)<br>
&gt; [2016-02-21 18:49:15.637745] W [socket.c:588:__socket_rwv]<br>
&gt; 0-gv0-client-1: readv on (sanitized IP of glusterfs2):49152 failed (No<br>
&gt; data available)<br>
&gt; [2016-02-21 18:49:15.637824] I [MSGID: 114018]<br>
&gt; [client.c:2030:client_rpc_notify] 0-gv0-client-1: disconnected from<br>
&gt; gv0-client-1. Client process will keep trying to connect to glusterd<br>
&gt; until brick&#39;s port is available<br>
&gt; [2016-02-21 18:49:24.198431] E [socket.c:2278:socket_connect_finish]<br>
&gt; 0-glusterfs: connection to (sanitized IP of glusterfs2):24007 failed<br>
&gt; (Connection refused)<br>
&gt; [2016-02-21 18:49:26.204811] E [socket.c:2278:socket_connect_finish]<br>
&gt; 0-gv0-client-1: connection to (sanitized IP of glusterfs2):24007 failed<br>
&gt; (Connection refused)<br>
&gt; [2016-02-21 18:49:38.366559] I [MSGID: 108031]<br>
&gt; [afr-common.c:1883:afr_local_discovery_cbk] 0-gv0-replicate-0: selecting<br>
&gt; local read_child gv0-client-0<br>
&gt; [2016-02-21 18:50:54.605535] I [glusterfsd-mgmt.c:1596:mgmt_getspec_cbk]<br>
&gt; 0-glusterfs: No change in volfile, continuing<br>
&gt; [2016-02-21 18:50:54.605639] E [MSGID: 114058]<br>
&gt; [client-handshake.c:1524:client_query_portmap_cbk] 0-gv0-client-1:<br>
&gt; failed to get the port number for remote subvolume. Please run &#39;gluster<br>
&gt; volume status&#39; on server to see if brick process is running.<br>
&gt;<br>
&gt;<br>
</div></div><div class="HOEnZb"><div class="h5">&gt; _______________________________________________<br>
&gt; Gluster-users mailing list<br>
&gt; <a href="mailto:Gluster-users@gluster.org">Gluster-users@gluster.org</a><br>
&gt; <a href="http://www.gluster.org/mailman/listinfo/gluster-users" rel="noreferrer" target="_blank">http://www.gluster.org/mailman/listinfo/gluster-users</a><br>
</div></div></blockquote></div><br></div>