Hi,
If there was only one client, there were not any problems even the traffic was very heavy. But if I used several clients to write the same volume, then I could see the segmentation fault. I used gdb to debug, but the performance was much lower than the previous test results, and we couldn't see the errors. We thought that the problem only occurred when multiple clients wrote the same volume with a very high performance (e.g., more than 1GiB/s each client).<DIV style="COLOR: #000"><DIV style="PADDING-RIGHT: 0px; PADDING-LEFT: 0px; FONT-SIZE: 12px; PADDING-BOTTOM: 2px; PADDING-TOP: 2px; FONT-FAMILY: Arial Narrow">------------------&nbsp;原始邮件&nbsp;------------------</DIV><DIV style="PADDING-RIGHT: 8px; PADDING-LEFT: 8px; FONT-SIZE: 12px; BACKGROUND: #efefef; PADDING-BOTTOM: 8px; PADDING-TOP: 8px"><DIV><B>发件人:</B>&nbsp;&quot;Ben&nbsp;Turner&quot;&lt;bturner@redhat.com&gt;<wbr/></DIV><DIV><B>发送时间:</B>&nbsp;2017年11月5日(星期天) 凌晨3:00</DIV><DIV><B>收件人:</B>&nbsp;&quot;自由人&quot;&lt;21291285@qq.com&gt;;</DIV><DIV><B>抄送:</B>&nbsp;&quot;gluster-users&quot;&lt;gluster-users@gluster.org&gt;;</DIV><DIV><B>主题:</B>&nbsp;Re: [Gluster-users] glusterfs segmentation fault in rdma mode</DIV></DIV></DIV>This looks like there could be some some problem requesting / leaking / whatever memory but without looking at the core its tought to tell for sure.&nbsp;&nbsp; Note:<br/><br/>/usr/lib64/libglusterfs.so.0(_gf_msg_backtrace_nomem+0x78)[0x7f95bc54e618]<br/><br/>Can you open up a bugzilla and get us the core file to review?<br/><br/>-b<br/><br/>----- Original Message -----<br/>&gt; From: &quot;自由人&quot; &lt;21291285@qq.com&gt;<br/>&gt; To: &quot;gluster-users&quot; &lt;gluster-users@gluster.org&gt;<br/>&gt; Sent: Saturday, November 4, 2017 5:27:50 AM<br/>&gt; Subject: [Gluster-users] glusterfs segmentation fault in rdma mode<br/>&gt; <br/>&gt; <br/>&gt; <br/>&gt; Hi, All,<br/>&gt; <br/>&gt; <br/>&gt; <br/>&gt; <br/>&gt; I used Infiniband to connect all GlusterFS nodes and the clients. Previously<br/>&gt; I run IP over IB and everything was OK. Now I used rdma transport mode<br/>&gt; instead. And then I ran the traffic. After I while, the glusterfs process<br/>&gt; exited because of segmentation fault.<br/>&gt; <br/>&gt; <br/>&gt; <br/>&gt; <br/>&gt; Here were the messages when I saw segmentation fault:<br/>&gt; <br/>&gt; pending frames:<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(1) op(WRITE)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; frame : type(0) op(0)<br/>&gt; <br/>&gt; patchset: git:// git.gluster.org/glusterfs.git<br/>&gt; <br/>&gt; signal received: 11<br/>&gt; <br/>&gt; time of crash:<br/>&gt; <br/>&gt; 2017-11-01 11:11:23<br/>&gt; <br/>&gt; configuration details:<br/>&gt; <br/>&gt; argp 1<br/>&gt; <br/>&gt; backtrace 1<br/>&gt; <br/>&gt; dlfcn 1<br/>&gt; <br/>&gt; libpthread 1<br/>&gt; <br/>&gt; llistxattr 1<br/>&gt; <br/>&gt; setfsid 1<br/>&gt; <br/>&gt; spinlock 1<br/>&gt; <br/>&gt; epoll.h 1<br/>&gt; <br/>&gt; xattr.h 1<br/>&gt; <br/>&gt; st_atim.tv_nsec 1<br/>&gt; <br/>&gt; package-string: glusterfs 3.11.0<br/>&gt; <br/>&gt; /usr/lib64/ libglusterfs.so.0(_gf_msg_backtrace_nomem+0x78)[0x7f95bc54e618 ]<br/>&gt; <br/>&gt; /usr/lib64/ libglusterfs.so.0(gf_print_trace+0x324)[0x7f95bc557834 ]<br/>&gt; <br/>&gt; /lib64/ libc.so.6(+0x32510)[0x7f95bace2510 ]<br/>&gt; <br/>&gt; The client OS was CentOS 7.3. The server OS was CentOS 6.5. The GlusterFS<br/>&gt; version was 3.11.0 both in clients and servers. The Infiniband card was<br/>&gt; Mellanox. The Mellanox IB driver version was v4.1-1.0.2 (27 Jun 2017) both<br/>&gt; in clients and servers.<br/>&gt; <br/>&gt; <br/>&gt; Is rdma code stable for GlusterFS? Need I upgrade the IB driver or apply a<br/>&gt; patch?<br/>&gt; <br/>&gt; Thanks!<br/>&gt; <br/>&gt; _______________________________________________<br/>&gt; Gluster-users mailing list<br/>&gt; Gluster-users@gluster.org<br/>&gt; http://lists.gluster.org/mailman/listinfo/gluster-users