<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style>
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt">Hello all,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; We have a gluster replicate (with arbiter) &nbsp;volumes that we are getting “Transport endpoint is not connected” with on a rotating basis &nbsp;from each of the two file servers, and a third host that has the
 arbiter bricks on.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">This is happening when trying to run a heal on all the volumes on the gluster hosts &nbsp;&nbsp;When I get the status of all the volumes all looks good.
<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;This behavior seems to be a forshadowing of the gluster volumes becoming unresponsive to our vm cluster. &nbsp;As well as one of the file servers have two processes for each of the volumes instead of one
 per volume. Eventually the affected file server<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">will drop off the listed peers. Restarting glusterd/glusterfsd on the affected file server does not take care of the issue, we have to bring down both file<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Servers due to the volumes not being seen by the vm cluster after the errors start occurring. I had seen that there were bug reports about the “Transport endpoint is not connected” on earlier versions of Gluster
 however had thought that<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">It had been addressed. &nbsp;<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Dmesg did have some entries for “a possible syn flood on port *” which we changed the &nbsp;sysctl to “net.ipv4.tcp_max_syn_backlog = 2048” which seemed to help the syn flood messages but not the underlying
 volume issues.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp; I have put the versions of all the Gluster packages installed below as well as the &nbsp;&nbsp;“Heal” and “Status” commands showing the volumes are
<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; This has just started happening but cannot definitively say if this started occurring after an update or not.&nbsp;
<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Thanks for any assistance.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Running Heal &nbsp;:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">gluster volume heal ovirt_engine info<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Brick ****1.rrc.local:/bricks/brick0/ovirt_engine<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Status: Connected<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Number of entries: 0<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Brick ****3.rrc.local:/bricks/brick0/ovirt_engine<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Status: Transport endpoint is not connected<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Number of entries: -<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Brick *****3.rrc.local:/bricks/arb-brick/ovirt_engine<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Status: Transport endpoint is not connected<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Number of entries: - <o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Running status :<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">gluster volume status ovirt_engine<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Status of volume: ovirt_engine<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Gluster process&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; TCP Port&nbsp; RDMA Port&nbsp; Online&nbsp; Pid<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">------------------------------------------------------------------------------<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Brick*****.rrc.local:/bricks/brick0/ov<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">irt_engine&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 49152&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Y&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 5521<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Brick fs2-tier3.rrc.local:/bricks/brick0/ov<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">irt_engine&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 49152&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Y&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 6245<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Brick ****.rrc.local:/bricks/arb-b<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">rick/ovirt_engine&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 49152&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Y&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 3526<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Self-heal Daemon on localhost&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;N/A&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; N/A&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Y&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 5509<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Self-heal Daemon on ***.rrc.local&nbsp;&nbsp;&nbsp;&nbsp; N/A&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; N/A&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Y&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 6218<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Self-heal Daemon on ***.rrc.local&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; N/A&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; N/A&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Y&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 3501<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Self-heal Daemon on ****.rrc.local N/A&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; N/A&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;Y&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 3657<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Self-heal Daemon on *****.rrc.local&nbsp;&nbsp; N/A&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; N/A&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Y&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 3753<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Self-heal Daemon on ****.rrc.local N/A&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; N/A&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Y&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 17284<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Task Status of Volume ovirt_engine<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">------------------------------------------------------------------------------<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">There are no active volume tasks<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">/etc/glusterd.vol.&nbsp;&nbsp; :<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">volume management<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp; type mgmt/glusterd<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp; option working-directory /var/lib/glusterd<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp; option transport-type socket,rdma<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp; option transport.socket.keepalive-time 10<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp; option transport.socket.keepalive-interval 2<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp; option transport.socket.read-fail-log off<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp; option ping-timeout 0<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp; option event-threads 1<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">&nbsp;&nbsp;&nbsp; option rpc-auth-allow-insecure on<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">#&nbsp;&nbsp; option transport.address-family inet6<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">#&nbsp;&nbsp; option base-port 49152<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">end-volume<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">rpm -qa |grep gluster<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">glusterfs-3.12.13-1.el7.x86_64<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">glusterfs-gnfs-3.12.13-1.el7.x86_64<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">glusterfs-api-3.12.13-1.el7.x86_64<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">glusterfs-cli-3.12.13-1.el7.x86_64<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">glusterfs-client-xlators-3.12.13-1.el7.x86_64<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">glusterfs-fuse-3.12.13-1.el7.x86_64<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">centos-release-gluster312-1.0-2.el7.centos.noarch<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">glusterfs-rdma-3.12.13-1.el7.x86_64<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">glusterfs-libs-3.12.13-1.el7.x86_64<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">glusterfs-server-3.12.13-1.el7.x86_64<o:p></o:p></span></p>
</div>
</body>
</html>