<div dir="ltr"><div dir="ltr">did all the suggestion as mentioned in the log trace , have another setup using root user , but there i have issue on the ssh command as i am unable to change the ssh port to use default 22, but my servers (azure aks engine)  are configure to using 2222 where i am unable to change the ports , restart of ssh service giving me error!<div><br></div><div>Is this syntax correct to config the ssh-command:</div><div>gluster volume geo-replication vol_041afbc53746053368a1840607636e97 xxx.xx.xxx.xx::vol_a5aee81a873c043c99a938adcb5b5781 <b>config ssh-command &#39;/usr/sbin/sshd -D  -p 2222&#39;</b><br></div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sun, Mar 24, 2019 at 4:38 PM Maurya M &lt;<a href="mailto:mauryam@gmail.com">mauryam@gmail.com</a>&gt; wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr">Did give the persmission on both &quot;/var/log/glusterfs/&quot; &amp; &quot;/var/lib/glusterd/&quot; too, but seems the directory where i mounted using heketi is having issues:<div><br></div><div><p class="MsoNormal" style="margin:0in 0in 0.0001pt;font-size:11pt;font-family:Calibri,sans-serif"><span style="color:rgb(31,73,125)">[2019-03-22 09:48:21.546308] E
[syncdutils(worker
/var/lib/heketi/mounts/vg_aee3df7b0bb2451bc00a73358c5196a2/brick_b3eab2394433f02f5617012d4ae3c28f/brick):305:log_raise_exception]
&lt;top&gt;: connection to peer is broken</span></p>

<p class="MsoNormal" style="margin:0in 0in 0.0001pt;font-size:11pt;font-family:Calibri,sans-serif"><span style="color:rgb(31,73,125);background:yellow">[2019-03-22 09:48:21.546662] E [syncdutils(worker
/var/lib/heketi/mounts/vg_aee3df7b0bb2451bc00a73358c5196a2/brick_b3eab2394433f02f5617012d4ae3c28f/brick):309:log_raise_exception]
&lt;top&gt;: getting &quot;No such file or directory&quot;errors is most likely
due to MISCONFIGURATION, please remove all the public keys added by
geo-replication from authorized_keys file in slave nodes and run
Geo-replication create command again.</span></p>

<p class="MsoNormal" style="margin:0in 0in 0.0001pt;font-size:11pt;font-family:Calibri,sans-serif"><span style="color:rgb(31,73,125);background:yellow">[2019-03-22 09:48:21.546736] E [syncdutils(worker
/var/lib/heketi/mounts/vg_aee3df7b0bb2451bc00a73358c5196a2/brick_b3eab2394433f02f5617012d4ae3c28f/brick):316:log_raise_exception]
&lt;top&gt;: If `gsec_create container` was used, then run `gluster volume
geo-replication &lt;MASTERVOL&gt;
[&lt;SLAVEUSER&gt;@]&lt;SLAVEHOST&gt;::&lt;SLAVEVOL&gt; config remote-gsyncd
&lt;GSYNCD_PATH&gt; (Example GSYNCD_PATH: `/usr/libexec/glusterfs/gsyncd`)</span></p>

<p class="MsoNormal" style="margin:0in 0in 0.0001pt;font-size:11pt;font-family:Calibri,sans-serif"><span style="color:rgb(31,73,125);background:yellow">[2019-03-22 09:48:21.546858] E [syncdutils(worker
/var/lib/heketi/mounts/vg_aee3df7b0bb2451bc00a73358c5196a2/brick_b3eab2394433f02f5617012d4ae3c28f/brick):801:errlog]
Popen: command returned error    cmd=ssh
-oPasswordAuthentication=no -oStrictHostKeyChecking=no -i
/var/lib/glusterd/geo-replication/secret.pem -p 22 -oControlMaster=auto -S
/tmp/gsyncd-aux-ssh-OaPGc3/c784230c9648efa4d529975bd779c551.sock <a href="mailto:azureuser@172.16.201.35" style="color:blue" target="_blank">azureuser@172.16.201.35</a>
/nonexistent/gsyncd slave vol_041afbc53746053368a1840607636e97 <a href="mailto:azureuser@172.16.201.35::vol_a5aee81a873c043c99a938adcb5b5781" style="color:blue" target="_blank">azureuser@172.16.201.35::vol_a5aee81a873c043c99a938adcb5b5781</a>
--master-node 172.16.189.4 --master-node-id
dd4efc35-4b86-4901-9c00-483032614c35 --master-brick
/var/lib/heketi/mounts/vg_aee3df7b0bb2451bc00a73358c5196a2/brick_b3eab2394433f02f5617012d4ae3c28f/brick
--local-node 172.16.201.35 --local-node-id 7eb0a2b6-c4d6-41b1-a346-0638dbf8d779
--slave-timeout 120 --slave-log-level INFO --slave-gluster-log-level INFO
--slave-gluster-command-dir /usr/sbin      error=127</span></p>

<p class="MsoNormal" style="margin:0in 0in 0.0001pt;font-size:11pt;font-family:Calibri,sans-serif"><span style="color:rgb(31,73,125);background:yellow">[2019-03-22 09:48:21.546977] E [syncdutils(worker /var/lib/heketi/mounts/vg_aee3df7b0bb2451bc00a73358c5196a2/brick_b3eab2394433f02f5617012d4ae3c28f/brick):805:logerr]
Popen: ssh&gt; bash: /nonexistent/gsyncd: No such file or directory</span><span style="color:rgb(31,73,125)"></span></p>

<p class="MsoNormal" style="margin:0in 0in 0.0001pt;font-size:11pt;font-family:Calibri,sans-serif"><span style="color:rgb(31,73,125)">[2019-03-22 09:48:21.565583] I
[repce(agent
/var/lib/heketi/mounts/vg_aee3df7b0bb2451bc00a73358c5196a2/brick_b3eab2394433f02f5617012d4ae3c28f/brick):80:service_loop]
RepceServer: terminating on reaching EOF.</span></p>

<p class="MsoNormal" style="margin:0in 0in 0.0001pt;font-size:11pt;font-family:Calibri,sans-serif"><span style="color:rgb(31,73,125)">[2019-03-22 09:48:21.565745] I
[monitor(monitor):266:monitor] Monitor: worker died before establishing
connection      
brick=/var/lib/heketi/mounts/vg_aee3df7b0bb2451bc00a73358c5196a2/brick_b3eab2394433f02f5617012d4ae3c28f/brick</span></p>

<p class="MsoNormal" style="margin:0in 0in 0.0001pt;font-size:11pt;font-family:Calibri,sans-serif"><span style="color:rgb(31,73,125)">[2019-03-22 09:48:21.579195] I
[gsyncdstatus(monitor):245:set_worker_status] GeorepStatus: Worker Status
Change status=Faulty</span></p></div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Fri, Mar 22, 2019 at 10:23 PM Sunny Kumar &lt;<a href="mailto:sunkumar@redhat.com" target="_blank">sunkumar@redhat.com</a>&gt; wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Hi Maurya,<br>
<br>
Looks like hook script is failed to set permissions for azureuser on<br>
&quot;/var/log/glusterfs&quot;.<br>
You can assign permission manually for directory then it will work.<br>
<br>
-Sunny<br>
<br>
On Fri, Mar 22, 2019 at 2:07 PM Maurya M &lt;<a href="mailto:mauryam@gmail.com" target="_blank">mauryam@gmail.com</a>&gt; wrote:<br>
&gt;<br>
&gt; hi Sunny,<br>
&gt;  Passwordless ssh to :<br>
&gt;<br>
&gt; ssh -oPasswordAuthentication=no -oStrictHostKeyChecking=no -i /var/lib/glusterd/geo-replication/secret.pem -p 22 <a href="mailto:azureuser@172.16.201.35" target="_blank">azureuser@172.16.201.35</a><br>
&gt;<br>
&gt; is login, but when the whole command is run getting permission issues again::<br>
&gt;<br>
&gt; ssh -oPasswordAuthentication=no -oStrictHostKeyChecking=no -i /var/lib/glusterd/geo-replication/secret.pem -p 22 <a href="mailto:azureuser@172.16.201.35" target="_blank">azureuser@172.16.201.35</a> gluster --xml --remote-host=localhost volume info vol_a5aee81a873c043c99a938adcb5b5781 -v<br>
&gt; ERROR: failed to create logfile &quot;/var/log/glusterfs/cli.log&quot; (Permission denied)<br>
&gt; ERROR: failed to open logfile /var/log/glusterfs/cli.log<br>
&gt;<br>
&gt; any idea here ?<br>
&gt;<br>
&gt; thanks,<br>
&gt; Maurya<br>
&gt;<br>
&gt;<br>
&gt; On Thu, Mar 21, 2019 at 2:43 PM Maurya M &lt;<a href="mailto:mauryam@gmail.com" target="_blank">mauryam@gmail.com</a>&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt; hi Sunny,<br>
&gt;&gt;  i did use the [1] link for the setup, when i encountered this error during ssh-copy-id : (so setup the passwordless ssh, by manually copied the private/ public keys to all the nodes , both master &amp; slave)<br>
&gt;&gt;<br>
&gt;&gt; [root@k8s-agentpool1-24779565-1 ~]# ssh-copy-id geouser@xxx.xx.xxx.x<br>
&gt;&gt; /usr/bin/ssh-copy-id: INFO: Source of key(s) to be installed: &quot;/root/.ssh/id_rsa.pub&quot;<br>
&gt;&gt; The authenticity of host &#39; xxx.xx.xxx.x   ( xxx.xx.xxx.x  )&#39; can&#39;t be established.<br>
&gt;&gt; ECDSA key fingerprint is SHA256:B2rNaocIcPjRga13oTnopbJ5KjI/7l5fMANXc+KhA9s.<br>
&gt;&gt; ECDSA key fingerprint is MD5:1b:70:f9:7a:bf:35:33:47:0c:f2:c1:cd:21:e2:d3:75.<br>
&gt;&gt; Are you sure you want to continue connecting (yes/no)? yes<br>
&gt;&gt; /usr/bin/ssh-copy-id: INFO: attempting to log in with the new key(s), to filter out any that are already installed<br>
&gt;&gt; /usr/bin/ssh-copy-id: INFO: 1 key(s) remain to be installed -- if you are prompted now it is to install the new keys<br>
&gt;&gt; Permission denied (publickey).<br>
&gt;&gt;<br>
&gt;&gt; To start afresh what all needs to teardown / delete, do we have any script for it ? where all the pem keys do i need to delete?<br>
&gt;&gt;<br>
&gt;&gt; thanks,<br>
&gt;&gt; Maurya<br>
&gt;&gt;<br>
&gt;&gt; On Thu, Mar 21, 2019 at 2:12 PM Sunny Kumar &lt;<a href="mailto:sunkumar@redhat.com" target="_blank">sunkumar@redhat.com</a>&gt; wrote:<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Hey you can start a fresh I think you are not following proper setup steps.<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Please follow these steps [1] to create geo-rep session, you can<br>
&gt;&gt;&gt; delete the old one and do a fresh start. Or alternative you can use<br>
&gt;&gt;&gt; this tool[2] to setup geo-rep.<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; [1]. <a href="https://docs.gluster.org/en/latest/Administrator%20Guide/Geo%20Replication/" rel="noreferrer" target="_blank">https://docs.gluster.org/en/latest/Administrator%20Guide/Geo%20Replication/</a><br>
&gt;&gt;&gt; [2]. <a href="http://aravindavk.in/blog/gluster-georep-tools/" rel="noreferrer" target="_blank">http://aravindavk.in/blog/gluster-georep-tools/</a><br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; /Sunny<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; On Thu, Mar 21, 2019 at 11:28 AM Maurya M &lt;<a href="mailto:mauryam@gmail.com" target="_blank">mauryam@gmail.com</a>&gt; wrote:<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt; Hi Sunil,<br>
&gt;&gt;&gt; &gt;  I did run the on the slave node :<br>
&gt;&gt;&gt; &gt;  /usr/libexec/glusterfs/set_geo_rep_pem_keys.sh azureuser vol_041afbc53746053368a1840607636e97 vol_a5aee81a873c043c99a938adcb5b5781<br>
&gt;&gt;&gt; &gt; getting this message &quot;/home/azureuser/common_secret.pem.pub not present. Please run geo-replication command on master with push-pem option to generate the file&quot;<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt; So went back and created the session again, no change, so manually copied the common_secret.pem.pub to /home/azureuser/ but still the set_geo_rep_pem_keys.sh is looking the pem file in different name :  COMMON_SECRET_PEM_PUB=${master_vol}_${slave_vol}_common_secret.pem.pub , change the name of pem , ran the command again :<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt;  /usr/libexec/glusterfs/set_geo_rep_pem_keys.sh azureuser vol_041afbc53746053368a1840607636e97 vol_a5aee81a873c043c99a938adcb5b5781<br>
&gt;&gt;&gt; &gt; Successfully copied file.<br>
&gt;&gt;&gt; &gt; Command executed successfully.<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt; - went back and created the session , start the geo-replication , still seeing the  same error in logs. Any ideas ?<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt; thanks,<br>
&gt;&gt;&gt; &gt; Maurya<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt; On Wed, Mar 20, 2019 at 11:07 PM Sunny Kumar &lt;<a href="mailto:sunkumar@redhat.com" target="_blank">sunkumar@redhat.com</a>&gt; wrote:<br>
&gt;&gt;&gt; &gt;&gt;<br>
&gt;&gt;&gt; &gt;&gt; Hi Maurya,<br>
&gt;&gt;&gt; &gt;&gt;<br>
&gt;&gt;&gt; &gt;&gt; I guess you missed last trick to distribute keys in slave node. I see<br>
&gt;&gt;&gt; &gt;&gt; this is non-root geo-rep setup so please try this:<br>
&gt;&gt;&gt; &gt;&gt;<br>
&gt;&gt;&gt; &gt;&gt;<br>
&gt;&gt;&gt; &gt;&gt; Run the following command as root in any one of Slave node.<br>
&gt;&gt;&gt; &gt;&gt;<br>
&gt;&gt;&gt; &gt;&gt; /usr/local/libexec/glusterfs/set_geo_rep_pem_keys.sh  &lt;slave_user&gt;<br>
&gt;&gt;&gt; &gt;&gt; &lt;master_volume&gt; &lt;slave_volume&gt;<br>
&gt;&gt;&gt; &gt;&gt;<br>
&gt;&gt;&gt; &gt;&gt; - Sunny<br>
&gt;&gt;&gt; &gt;&gt;<br>
&gt;&gt;&gt; &gt;&gt; On Wed, Mar 20, 2019 at 10:47 PM Maurya M &lt;<a href="mailto:mauryam@gmail.com" target="_blank">mauryam@gmail.com</a>&gt; wrote:<br>
&gt;&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt;&gt; &gt; Hi all,<br>
&gt;&gt;&gt; &gt;&gt; &gt;  Have setup a 3 master nodes - 3 slave nodes (gluster 4.1) for geo-replication, but once have the geo-replication configure the status is always on &quot;Created&#39;,<br>
&gt;&gt;&gt; &gt;&gt; &gt; even after have force start the session.<br>
&gt;&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt;&gt; &gt; On close inspect of the logs on the master node seeing this error:<br>
&gt;&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt;&gt; &gt; &quot;E [syncdutils(monitor):801:errlog] Popen: command returned error   cmd=ssh -oPasswordAuthentication=no -oStrictHostKeyChecking=no -i /var/lib/glusterd/geo-replication/secret.pem -p 22 azureuser@xxxxx.xxxx..xxx. gluster --xml --remote-host=localhost volume info vol_a5ae34341a873c043c99a938adcb5b5781      error=255&quot;<br>
&gt;&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt;&gt; &gt; Any ideas what is issue?<br>
&gt;&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt;&gt; &gt; thanks,<br>
&gt;&gt;&gt; &gt;&gt; &gt; Maurya<br>
&gt;&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt;&gt; &gt;&gt; &gt; _______________________________________________<br>
&gt;&gt;&gt; &gt;&gt; &gt; Gluster-users mailing list<br>
&gt;&gt;&gt; &gt;&gt; &gt; <a href="mailto:Gluster-users@gluster.org" target="_blank">Gluster-users@gluster.org</a><br>
&gt;&gt;&gt; &gt;&gt; &gt; <a href="https://lists.gluster.org/mailman/listinfo/gluster-users" rel="noreferrer" target="_blank">https://lists.gluster.org/mailman/listinfo/gluster-users</a><br>
</blockquote></div>
</blockquote></div>