<div dir="ltr">FYI, unless by some miracle there is no way this feature will be in by Sunday.  This feature is one of the hardest part of Heketi which is why <a href="https://github.com/heketi/heketi/issues/161">https://github.com/heketi/heketi/issues/161</a> has taken so long.<div><br></div><div>The brick set is the heart of this change.  A brick set is how Heketi sets up the replicas in a ring.  For example: in a distributed replicated 2x3, brick A would need A1 and A2 as replicas.  Therefore, A,A1,A2 are a set.  Same applies for B,B1,B2.</div><div><br></div><div>Replacing a device which contains B1 (for example), would need a replacement brick which satisfies B and B2 for the set to be complete.  Same thing applies for EC where it is A,A1...A(n).</div><div><br></div><div>This is a big change, which requires a good algorithm, execution, and testing.</div><div><br></div><div>- Luis</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Feb 16, 2017 at 2:25 PM, Mohamed Ashiq Liyazudeen <span dir="ltr">&lt;<a href="mailto:mliyazud@redhat.com" target="_blank">mliyazud@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Luis,<br>
<br>
I agree on adding the VolumeId part to db for bricks. I didn&#39;t get what you mean by brick peers?<br>
<br>
I wanted to know better about the allocator behaviors based on number of zones. If you see our example topology file, It has 4 nodes with multiple devices but 2 nodes are associated to a zone. There are only two zones now and while creating replica three volume how is the allocator creates ring of devices? Mainly in this case we can not ignore both zones.<br>
<br>
Also wanted to know in case of volume expand how are we approaching. I thought it will be using something similar to give the state(where the present brick are) of existing volume  to allocator and allocator will give back ring without those zones or nodes. But I think (correct me if I am wrong) Volume is changed by adding appropriate bricks, In the sense replica 3(3x1) is added bricks and made distribute replica 3(3x2). I agree this is the way to go, just trying to understand allocator better.<br>
<br>
We need this feature to be in by Sunday. I will be working on it mostly, Will definitely mail but is there any place to chat with you in case of doubts and quick answers?<br>
<br>
Tomorrow as first thing will add the VolumeId and brick peers(not sure what is it exactly).<br>
<br>
--<br>
Ashiq<br>
<div class="HOEnZb"><div class="h5"><br>
----- Original Message -----<br>
From: &quot;Luis Pabon&quot; &lt;<a href="mailto:lpabon@chrysalix.org">lpabon@chrysalix.org</a>&gt;<br>
To: &quot;Mohamed Ashiq Liyazudeen&quot; &lt;<a href="mailto:mliyazud@redhat.com">mliyazud@redhat.com</a>&gt;<br>
Cc: <a href="mailto:heketi-devel@gluster.org">heketi-devel@gluster.org</a><br>
Sent: Thursday, February 16, 2017 11:32:55 PM<br>
Subject: Re: [heketi-devel] Remove Device: Used to distribute all the bricks from device to other devices<br>
<br>
After we agree on the algorithm, the first PR would be to add the necessary<br>
framework to the DB to support #676.<br>
<br>
- Luis<br>
<br>
On Thu, Feb 16, 2017 at 1:00 PM, Luis Pabon &lt;<a href="mailto:lpabon@chrysalix.org">lpabon@chrysalix.org</a>&gt; wrote:<br>
<br>
&gt; Great summary.  Yes, the next step should be to figure out how to enhance<br>
&gt; the ring to return a brick for another zone.  It could be as simple as:<br>
&gt;<br>
&gt; If current bricks in set are in different zones:<br>
&gt;     Get a ring<br>
&gt;     Remove disks from the ring in zones already used<br>
&gt;     Return devices until one is found with the appropriate size<br>
&gt; else:<br>
&gt;    Get a ring<br>
&gt;    Return devices until one is found with the appropriate size<br>
&gt;<br>
&gt; Also, order of the disks may matter.  This part I am not sure of, but, we<br>
&gt; may need to make sure of the order of the bricks were added to the volume<br>
&gt; during &#39;create&#39;.  This may be necessary to determine which of the bricks in<br>
&gt; the brick set are in different zones.<br>
&gt;<br>
&gt; We may have to add a new DB entry in the Brick Entry.  For example: Brick<br>
&gt; peers, and Volume ID<br>
&gt;<br>
&gt; - Luis<br>
&gt;<br>
&gt; On Wed, Feb 15, 2017 at 2:17 PM, Mohamed Ashiq Liyazudeen &lt;<br>
&gt; <a href="mailto:mliyazud@redhat.com">mliyazud@redhat.com</a>&gt; wrote:<br>
&gt;<br>
&gt;&gt; Hi,<br>
&gt;&gt;<br>
&gt;&gt; This mail talks about the PR[1]<br>
&gt;&gt;<br>
&gt;&gt; Let me start off with what is planned to do in this.<br>
&gt;&gt;<br>
&gt;&gt; We only support this feature for Replicate and Distribute Replicate<br>
&gt;&gt; Volume.<br>
&gt;&gt; Refer: <a href="https://gluster.readthedocs.io/en/latest/Administrator%20Gui" rel="noreferrer" target="_blank">https://gluster.readthedocs.<wbr>io/en/latest/Administrator%<wbr>20Gui</a><br>
&gt;&gt; de/Managing%20Volumes/#<wbr>replace-brick<br>
&gt;&gt;<br>
&gt;&gt; Removes all the brick from the device and start these bricks on other<br>
&gt;&gt; devices based on allocator. Heal is triggered automatically for replicate<br>
&gt;&gt; volumes on replace brick. Allocate and create new brick to replace. It<br>
&gt;&gt; stops the brick to be replaced, If it is not already down(kill the brick<br>
&gt;&gt; process). Then gluster replace brick which will replace the brick with new<br>
&gt;&gt; one and also starts the heals.<br>
&gt;&gt;<br>
&gt;&gt; If other nodes does not have sufficient storage then this command should<br>
&gt;&gt; fail.<br>
&gt;&gt;<br>
&gt;&gt; 1) If there are no bricks then tell user, It is clean to remove the<br>
&gt;&gt; device.<br>
&gt;&gt; 2) If there are bricks in the device, then find the volume they are<br>
&gt;&gt; related to from the list of volumes. Brickentry does not have the volume<br>
&gt;&gt; name it is associated to.<br>
&gt;&gt; 3) move the bricks to other devices by calling the allocator for the<br>
&gt;&gt; devices.<br>
&gt;&gt; 4) eliminate the device to be removed and all the nodes which are<br>
&gt;&gt; associated the volume already.<br>
&gt;&gt;<br>
&gt;&gt; We missed on the zone handling part. If there is a way to give the<br>
&gt;&gt; already used zone and node for the volume to allocator. Then allocator can<br>
&gt;&gt; return the devices which will be from different zone&#39;s node. I think 2,3,4<br>
&gt;&gt; will handle if there is only one zone. Let us know if there are any other<br>
&gt;&gt; risks or better ways to use allocator.<br>
&gt;&gt;<br>
&gt;&gt; [1] <a href="https://github.com/heketi/heketi/pull/676" rel="noreferrer" target="_blank">https://github.com/heketi/<wbr>heketi/pull/676</a><br>
&gt;&gt;<br>
&gt;&gt; --<br>
&gt;&gt; Regards,<br>
&gt;&gt; Mohamed Ashiq.L<br>
&gt;&gt;<br>
&gt;&gt; ______________________________<wbr>_________________<br>
&gt;&gt; heketi-devel mailing list<br>
&gt;&gt; <a href="mailto:heketi-devel@gluster.org">heketi-devel@gluster.org</a><br>
&gt;&gt; <a href="http://lists.gluster.org/mailman/listinfo/heketi-devel" rel="noreferrer" target="_blank">http://lists.gluster.org/<wbr>mailman/listinfo/heketi-devel</a><br>
&gt;&gt;<br>
&gt;<br>
&gt;<br>
<br>
--<br>
Regards,<br>
Mohamed Ashiq.L<br>
<br>
______________________________<wbr>_________________<br>
heketi-devel mailing list<br>
<a href="mailto:heketi-devel@gluster.org">heketi-devel@gluster.org</a><br>
<a href="http://lists.gluster.org/mailman/listinfo/heketi-devel" rel="noreferrer" target="_blank">http://lists.gluster.org/<wbr>mailman/listinfo/heketi-devel</a><br>
</div></div></blockquote></div><br></div>