<div dir="ltr"><div>All,<br><br></div>I was trying to debug regression failures on [1] and observed that split-brain-resolution.t was failing consistently.<br><div><div><div><br>=========================<br>TEST 45 (line 88): 0 get_pending_heal_count patchy<br>./tests/basic/afr/split-brain-resolution.t .. 45/45 RESULT 45: 1<br>./tests/basic/afr/split-brain-resolution.t .. Failed 17/45 subtests <br><br>Test Summary Report<br>-------------------<br>./tests/basic/afr/split-brain-resolution.t (Wstat: 0 Tests: 45 Failed: 17)<br>  Failed tests:  24-26, 28-36, 41-45<br></div><div><br></div><div><br></div><div>On probing deeper, I observed a curious fact - on most of the failures stat was not served from md-cache, but instead was wound down to afr which failed stat with EIO as the file was in split brain. So, I did another test:</div><div>* disabled md-cache</div><div>* mount glusterfs with attribute-timeout 0 and entry-timeout 0</div><div><br></div><div>Now the test fails always. So, I think the test relied on stat requests being absorbed either by kernel attribute cache or md-cache. When its not happening stats are reaching afr and resulting in failures of cmds like getfattr etc. Thoughts?<br></div><div><br></div><div>[1] <a href="https://review.gluster.org/#/c/20549/">https://review.gluster.org/#/c/20549/</a><br></div></div></div></div>