<div dir="auto">Hello all,<div dir="auto"><br></div><div dir="auto">I am trying to make a note of all gluster operations that happen over network inorder to be able to tune gluster nodes as required.</div><div dir="auto"><br></div><div dir="auto">First of all our setup is far from ideal, but  we want to tune it to the best as possible. </div><div dir="auto">-&gt; Our nodes are also LSF execution nodes and due to this, we have a shared load for cpu, memory and network. (For cpu, memory and network, we are planning to use cgroups to make enough resources available for gluster).</div><div dir="auto">-&gt; However, in our LSF setup, we allow jobs to use more than the requested memory  and hence, we can expect aggressive swapping when there&#39;s too much requirement. <br></div><div dir="auto">-&gt; on top of that, our swap disk, gluster bricks  and entire os filesystem comes from same raid disk. So, whenever there&#39;s swapping, our only disk&#39;s utilization goes over the top and in turn affects gluster IO. </div><div dir="auto">-&gt; slower performance is okay, as we will take necessary steps in time i.e kill jobs that are using memory more than the requested.</div><div dir="auto">-&gt; but we don&#39;t want network timeout or connection reset errors which could mess the entire cluster operations and would need a bit of heavy work to resolve them.</div><div dir="auto"><br></div><div dir="auto">-&gt; I&#39;m not sure if the above scenario can cause these timeout errors. However, there are other cases which can cause these and are also observed.</div><div dir="auto">-&gt; we increased transport.listen-backlog in gluster to a higher value: 200 and tuned kenel somaxcon=1024, syn_backlog=20480 </div><div dir="auto">-&gt; these are just random high values, but not sure if these are enough.</div><div dir="auto"><br></div><div dir="auto">-&gt; so, we can fairly expect timeout errors as our tuning  is  not  perfect. Hence, to be able to analyze these issues, I want to find out possible number of pending connections, network communications and for that, I need to know all the gluster operations and their frequency.</div><div dir="auto"><br></div><div dir="auto">Example:</div><div dir="auto">Self Heal daemon operations</div><div dir="auto">Peer communications for gluster peer status..does this happen?</div><div dir="auto">And etc.</div><div dir="auto"><br></div><div dir="auto">Thanks in advance.</div><div dir="auto"><br></div><div dir="auto">Regards,</div><div dir="auto">Jeevan.</div></div>