<div dir="ltr"><div dir="ltr"><div>Noticed the same when upgrading from 5.3 to 5.4, as mentioned.</div><div><br></div><div>I&#39;m confused though. Is actual replication affected, because the 5.4 server and the 3x 5.3 servers still show heal info as all 4 connected, and the files seem to be replicating correctly as well.</div><div><br></div><div>So what&#39;s actually affected - just the status command, or leaving 5.4 on one of the nodes is doing some damage to the underlying fs? Is it fixable by tweaking transport.socket.ssl-enabled? Does upgrading all servers to 5.4 resolve it, or should we revert back to 5.3?</div><div><div dir="ltr" class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><br>Sincerely,<br>Artem<br><br>--<br>Founder, <a href="http://www.androidpolice.com" target="_blank">Android Police</a>, <a href="http://www.apkmirror.com/" style="font-size:12.8px" target="_blank">APK Mirror</a><span style="font-size:12.8px">, Illogical Robot LLC</span></div><div dir="ltr"><a href="http://beerpla.net/" target="_blank">beerpla.net</a> | <a href="https://plus.google.com/+ArtemRussakovskii" target="_blank">+ArtemRussakovskii</a> | <a href="http://twitter.com/ArtemR" target="_blank">@ArtemR</a><br></div></div></div></div></div></div></div></div></div></div></div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Mar 5, 2019 at 2:02 AM Hu Bert &lt;<a href="mailto:revirii@googlemail.com">revirii@googlemail.com</a>&gt; wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">fyi: did a downgrade 5.4 -&gt; 5.3 and it worked. all replicas are up and<br>
running. Awaiting updated v5.4.<br>
<br>
thx :-)<br>
<br>
Am Di., 5. März 2019 um 09:26 Uhr schrieb Hari Gowtham &lt;<a href="mailto:hgowtham@redhat.com" target="_blank">hgowtham@redhat.com</a>&gt;:<br>
&gt;<br>
&gt; There are plans to revert the patch causing this error and rebuilt 5.4.<br>
&gt; This should happen faster. the rebuilt 5.4 should be void of this upgrade issue.<br>
&gt;<br>
&gt; In the meantime, you can use 5.3 for this cluster.<br>
&gt; Downgrading to 5.3 will work if it was just one node that was upgrade to 5.4<br>
&gt; and the other nodes are still in 5.3.<br>
&gt;<br>
&gt; On Tue, Mar 5, 2019 at 1:07 PM Hu Bert &lt;<a href="mailto:revirii@googlemail.com" target="_blank">revirii@googlemail.com</a>&gt; wrote:<br>
&gt; &gt;<br>
&gt; &gt; Hi Hari,<br>
&gt; &gt;<br>
&gt; &gt; thx for the hint. Do you know when this will be fixed? Is a downgrade<br>
&gt; &gt; 5.4 -&gt; 5.3 a possibility to fix this?<br>
&gt; &gt;<br>
&gt; &gt; Hubert<br>
&gt; &gt;<br>
&gt; &gt; Am Di., 5. März 2019 um 08:32 Uhr schrieb Hari Gowtham &lt;<a href="mailto:hgowtham@redhat.com" target="_blank">hgowtham@redhat.com</a>&gt;:<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; Hi,<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; This is a known issue we are working on.<br>
&gt; &gt; &gt; As the checksum differs between the updated and non updated node, the<br>
&gt; &gt; &gt; peers are getting rejected.<br>
&gt; &gt; &gt; The bricks aren&#39;t coming because of the same issue.<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; More about the issue: <a href="https://bugzilla.redhat.com/show_bug.cgi?id=1685120" rel="noreferrer" target="_blank">https://bugzilla.redhat.com/show_bug.cgi?id=1685120</a><br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; On Tue, Mar 5, 2019 at 12:56 PM Hu Bert &lt;<a href="mailto:revirii@googlemail.com" target="_blank">revirii@googlemail.com</a>&gt; wrote:<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; Interestingly: gluster volume status misses gluster1, while heal<br>
&gt; &gt; &gt; &gt; statistics show gluster1:<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; gluster volume status workdata<br>
&gt; &gt; &gt; &gt; Status of volume: workdata<br>
&gt; &gt; &gt; &gt; Gluster process                             TCP Port  RDMA Port  Online  Pid<br>
&gt; &gt; &gt; &gt; ------------------------------------------------------------------------------<br>
&gt; &gt; &gt; &gt; Brick gluster2:/gluster/md4/workdata        49153     0          Y       1723<br>
&gt; &gt; &gt; &gt; Brick gluster3:/gluster/md4/workdata        49153     0          Y       2068<br>
&gt; &gt; &gt; &gt; Self-heal Daemon on localhost               N/A       N/A        Y       1732<br>
&gt; &gt; &gt; &gt; Self-heal Daemon on gluster3                N/A       N/A        Y       2077<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; vs.<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; gluster volume heal workdata statistics heal-count<br>
&gt; &gt; &gt; &gt; Gathering count of entries to be healed on volume workdata has been successful<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; Brick gluster1:/gluster/md4/workdata<br>
&gt; &gt; &gt; &gt; Number of entries: 0<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; Brick gluster2:/gluster/md4/workdata<br>
&gt; &gt; &gt; &gt; Number of entries: 10745<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; Brick gluster3:/gluster/md4/workdata<br>
&gt; &gt; &gt; &gt; Number of entries: 10744<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; Am Di., 5. März 2019 um 08:18 Uhr schrieb Hu Bert &lt;<a href="mailto:revirii@googlemail.com" target="_blank">revirii@googlemail.com</a>&gt;:<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; Hi Miling,<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; well, there are such entries, but those haven&#39;t been a problem during<br>
&gt; &gt; &gt; &gt; &gt; install and the last kernel update+reboot. The entries look like:<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; PUBLIC_IP  <a href="http://gluster2.alpserver.de" rel="noreferrer" target="_blank">gluster2.alpserver.de</a> gluster2<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; 192.168.0.50 gluster1<br>
&gt; &gt; &gt; &gt; &gt; 192.168.0.51 gluster2<br>
&gt; &gt; &gt; &gt; &gt; 192.168.0.52 gluster3<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &#39;ping gluster2&#39; resolves to LAN IP; I removed the last entry in the<br>
&gt; &gt; &gt; &gt; &gt; 1st line, did a reboot ... no, didn&#39;t help. From<br>
&gt; &gt; &gt; &gt; &gt; /var/log/glusterfs/glusterd.log<br>
&gt; &gt; &gt; &gt; &gt;  on gluster 2:<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; [2019-03-05 07:04:36.188128] E [MSGID: 106010]<br>
&gt; &gt; &gt; &gt; &gt; [glusterd-utils.c:3483:glusterd_compare_friend_volume] 0-management:<br>
&gt; &gt; &gt; &gt; &gt; Version of Cksums persistent differ. local cksum = 3950307018, remote<br>
&gt; &gt; &gt; &gt; &gt; cksum = 455409345 on peer gluster1<br>
&gt; &gt; &gt; &gt; &gt; [2019-03-05 07:04:36.188314] I [MSGID: 106493]<br>
&gt; &gt; &gt; &gt; &gt; [glusterd-handler.c:3843:glusterd_xfer_friend_add_resp] 0-glusterd:<br>
&gt; &gt; &gt; &gt; &gt; Responded to gluster1 (0), ret: 0, op_ret: -1<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; Interestingly there are no entries in the brick logs of the rejected<br>
&gt; &gt; &gt; &gt; &gt; server. Well, not surprising as no brick process is running. The<br>
&gt; &gt; &gt; &gt; &gt; server gluster1 is still in rejected state.<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &#39;gluster volume start workdata force&#39; starts the brick process on<br>
&gt; &gt; &gt; &gt; &gt; gluster1, and some heals are happening on gluster2+3, but via &#39;gluster<br>
&gt; &gt; &gt; &gt; &gt; volume status workdata&#39; the volumes still aren&#39;t complete.<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; gluster1:<br>
&gt; &gt; &gt; &gt; &gt; ------------------------------------------------------------------------------<br>
&gt; &gt; &gt; &gt; &gt; Brick gluster1:/gluster/md4/workdata        49152     0          Y       2523<br>
&gt; &gt; &gt; &gt; &gt; Self-heal Daemon on localhost               N/A       N/A        Y       2549<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; gluster2:<br>
&gt; &gt; &gt; &gt; &gt; Gluster process                             TCP Port  RDMA Port  Online  Pid<br>
&gt; &gt; &gt; &gt; &gt; ------------------------------------------------------------------------------<br>
&gt; &gt; &gt; &gt; &gt; Brick gluster2:/gluster/md4/workdata        49153     0          Y       1723<br>
&gt; &gt; &gt; &gt; &gt; Brick gluster3:/gluster/md4/workdata        49153     0          Y       2068<br>
&gt; &gt; &gt; &gt; &gt; Self-heal Daemon on localhost               N/A       N/A        Y       1732<br>
&gt; &gt; &gt; &gt; &gt; Self-heal Daemon on gluster3                N/A       N/A        Y       2077<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; Hubert<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; Am Di., 5. März 2019 um 07:58 Uhr schrieb Milind Changire &lt;<a href="mailto:mchangir@redhat.com" target="_blank">mchangir@redhat.com</a>&gt;:<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; There are probably DNS entries or /etc/hosts entries with the public IP Addresses that the host names (gluster1, gluster2, gluster3) are getting resolved to.<br>
&gt; &gt; &gt; &gt; &gt; &gt; /etc/resolv.conf would tell which is the default domain searched for the node names and the DNS servers which respond to the queries.<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; On Tue, Mar 5, 2019 at 12:14 PM Hu Bert &lt;<a href="mailto:revirii@googlemail.com" target="_blank">revirii@googlemail.com</a>&gt; wrote:<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Good morning,<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; i have a replicate 3 setup with 2 volumes, running on version 5.3 on<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; debian stretch. This morning i upgraded one server to version 5.4 and<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; rebooted the machine; after the restart i noticed that:<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; - no brick process is running<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; - gluster volume status only shows the server itself:<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; gluster volume status workdata<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Status of volume: workdata<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Gluster process                             TCP Port  RDMA Port  Online  Pid<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; ------------------------------------------------------------------------------<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Brick gluster1:/gluster/md4/workdata        N/A       N/A        N       N/A<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; NFS Server on localhost                     N/A       N/A        N       N/A<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; - gluster peer status on the server<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; gluster peer status<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Number of Peers: 2<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Hostname: gluster3<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Uuid: c7b4a448-ca6a-4051-877f-788f9ee9bc4a<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; State: Peer Rejected (Connected)<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Hostname: gluster2<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Uuid: 162fea82-406a-4f51-81a3-e90235d8da27<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; State: Peer Rejected (Connected)<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; - gluster peer status on the other 2 servers:<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; gluster peer status<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Number of Peers: 2<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Hostname: gluster1<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Uuid: 9a360776-7b58-49ae-831e-a0ce4e4afbef<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; State: Peer Rejected (Connected)<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Hostname: gluster3<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Uuid: c7b4a448-ca6a-4051-877f-788f9ee9bc4a<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; State: Peer in Cluster (Connected)<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; I noticed that, in the brick logs, i see that the public IP is used<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; instead of the LAN IP. brick logs from one of the volumes:<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; rejected node: <a href="https://pastebin.com/qkpj10Sd" rel="noreferrer" target="_blank">https://pastebin.com/qkpj10Sd</a><br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; connected nodes: <a href="https://pastebin.com/8SxVVYFV" rel="noreferrer" target="_blank">https://pastebin.com/8SxVVYFV</a><br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Why is the public IP suddenly used instead of the LAN IP? Killing all<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; gluster processes and rebooting (again) didn&#39;t help.<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Thx,<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Hubert<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; _______________________________________________<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; Gluster-users mailing list<br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; <a href="mailto:Gluster-users@gluster.org" target="_blank">Gluster-users@gluster.org</a><br>
&gt; &gt; &gt; &gt; &gt; &gt;&gt; <a href="https://lists.gluster.org/mailman/listinfo/gluster-users" rel="noreferrer" target="_blank">https://lists.gluster.org/mailman/listinfo/gluster-users</a><br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; --<br>
&gt; &gt; &gt; &gt; &gt; &gt; Milind<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; _______________________________________________<br>
&gt; &gt; &gt; &gt; Gluster-users mailing list<br>
&gt; &gt; &gt; &gt; <a href="mailto:Gluster-users@gluster.org" target="_blank">Gluster-users@gluster.org</a><br>
&gt; &gt; &gt; &gt; <a href="https://lists.gluster.org/mailman/listinfo/gluster-users" rel="noreferrer" target="_blank">https://lists.gluster.org/mailman/listinfo/gluster-users</a><br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; --<br>
&gt; &gt; &gt; Regards,<br>
&gt; &gt; &gt; Hari Gowtham.<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; --<br>
&gt; Regards,<br>
&gt; Hari Gowtham.<br>
_______________________________________________<br>
Gluster-users mailing list<br>
<a href="mailto:Gluster-users@gluster.org" target="_blank">Gluster-users@gluster.org</a><br>
<a href="https://lists.gluster.org/mailman/listinfo/gluster-users" rel="noreferrer" target="_blank">https://lists.gluster.org/mailman/listinfo/gluster-users</a></blockquote></div>