<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<style type="text/css" style="display:none;"> P {margin-top:0;margin-bottom:0;} </style>
</head>
<body dir="ltr">
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
Some further bits of info on this.&nbsp; I've found a lot of similar issues related to linking, but I don't seem to have any of those same issues.</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<br>
</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
I've checked the gfids on all 3 of the replicas and they are the same, as are all extended attributes.</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<br>
</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
I did notice that the gfid is present in the `.remove_me` directory, though the file itself is not removed still.&nbsp; Perhaps this is the root of the problem?&nbsp; I don't know much about the `.remove_me` dir, and couldn't find similar issues though.</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<br>
</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
Thanks,</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
Tim<br>
</div>
<div id="appendonsend"></div>
<hr style="display:inline-block;width:98%" tabindex="-1">
<div id="divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" style="font-size:11pt" color="#000000"><b>From:</b> Timothy Orme<br>
<b>Sent:</b> Monday, October 21, 2019 10:50 AM<br>
<b>To:</b> gluster-users &lt;gluster-users@gluster.org&gt;<br>
<b>Subject:</b> FUSE Client Crashes On Shared File</font>
<div>&nbsp;</div>
</div>
<style type="text/css" style="display:none">
<!--
p
        {margin-top:0;
        margin-bottom:0}
-->
</style>
<div dir="ltr">
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12pt; color:rgb(0,0,0)">
Hello,</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12pt; color:rgb(0,0,0)">
<br>
</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12pt; color:rgb(0,0,0)">
I'm running gluster 6.5 on Amazon Linux 2 (CentOS 7 variant).&nbsp; I have a distributed-replicated cluster running, with sharding enabled for files over 512 MB.</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12pt; color:rgb(0,0,0)">
<br>
</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12pt; color:rgb(0,0,0)">
I tried issuing an `rm` for a large number of files, and seem to be consistently getting the client to crash on a specific file set.&nbsp; I see the following error in the logs:</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12pt; color:rgb(0,0,0)">
<br>
</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12pt; color:rgb(0,0,0)">
<span>[2019-10-21 17:43:19.875880] I [fuse-bridge.c:5142:fuse_init] 0-glusterfs-fuse: FUSE inited with protocol versions: glusterfs 7.24 kernel 7.26<br>
</span>
<div>[2019-10-21 17:43:19.875896] I [fuse-bridge.c:5753:fuse_graph_sync] 0-fuse: switched to graph 0<br>
</div>
<div>[2019-10-21 17:44:16.372054] W [MSGID: 109009] [dht-common.c:2807:dht_lookup_linkfile_cbk] 0-scratch-dht: /.shard/4b6d0aab-aa33-44dd-8d3f-2054712702dd.1: gfid different on data file on scratch-replicate-3, gfid local = 00000000-0000-0000-0000-000000000000,
 gfid node = 793507db-42e1-4b9e-9ce0-b2c2451f78dd <br>
</div>
<div>[2019-10-21 17:44:16.373429] W [MSGID: 109009] [dht-common.c:2562:dht_lookup_everywhere_cbk] 0-scratch-dht: /.shard/4b6d0aab-aa33-44dd-8d3f-2054712702dd.1: gfid differs on subvolume scratch-replicate-3, gfid local = 5c52fe2a-c580-42ae-b2cb-ce3cae39ffeb,
 gfid node = 793507db-42e1-4b9e-9ce0-b2c2451f78dd<br>
</div>
<div>[2019-10-21 17:44:16.373730] E [MSGID: 133010] [shard.c:2326:shard_common_lookup_shards_cbk] 0-scratch-shard: Lookup on shard 1 failed. Base file gfid = 4b6d0aab-aa33-44dd-8d3f-2054712702dd [Stale file handle]<br>
</div>
<div>pending frames:<br>
</div>
<div>frame : type(0) op(0)<br>
</div>
<div>frame : type(0) op(0)<br>
</div>
<div>frame : type(1) op(UNLINK)<br>
</div>
<div>frame : type(1) op(UNLINK)<br>
</div>
<div>frame : type(0) op(0)<br>
</div>
<div>frame : type(0) op(0)<br>
</div>
<div>patchset: git://git.gluster.org/glusterfs.git<br>
</div>
<div>signal received: 11<br>
</div>
<div>time of crash: <br>
</div>
<div>2019-10-21 17:44:16<br>
</div>
<div>configuration details:<br>
</div>
<div>argp 1<br>
</div>
<div>backtrace 1<br>
</div>
<div>dlfcn 1<br>
</div>
<div>libpthread 1<br>
</div>
<div>llistxattr 1<br>
</div>
<div>setfsid 1<br>
</div>
<div>spinlock 1<br>
</div>
<div>epoll.h 1<br>
</div>
<div>xattr.h 1<br>
</div>
<div>st_atim.tv_nsec 1<br>
</div>
<div>package-string: glusterfs 6.5<br>
</div>
<div>/lib64/libglusterfs.so.0(&#43;0x267cc)[0x7f5cc26f47cc]<br>
</div>
<div>/lib64/libglusterfs.so.0(gf_print_trace&#43;0x306)[0x7f5cc26ff1e6]<br>
</div>
<div>/lib64/libc.so.6(&#43;0x347e0)[0x7f5cc0d037e0]<br>
</div>
<div>/lib64/libuuid.so.1(&#43;0x25f0)[0x7f5cc1e5a5f0]<br>
</div>
<div>/lib64/libuuid.so.1(&#43;0x2674)[0x7f5cc1e5a674]<br>
</div>
<div>/lib64/libglusterfs.so.0(uuid_utoa&#43;0x1c)[0x7f5cc26fe38c]<br>
</div>
<div>/usr/lib64/glusterfs/6.5/xlator/features/shard.so(&#43;0xa7f9)[0x7f5cb2af67f9]<br>
</div>
<div>/usr/lib64/glusterfs/6.5/xlator/features/shard.so(&#43;0x9758)[0x7f5cb2af5758]<br>
</div>
<div>/usr/lib64/glusterfs/6.5/xlator/features/shard.so(&#43;0xa869)[0x7f5cb2af6869]<br>
</div>
<div>/usr/lib64/glusterfs/6.5/xlator/features/shard.so(&#43;0x700f)[0x7f5cb2af300f]<br>
</div>
<div>/usr/lib64/glusterfs/6.5/xlator/features/shard.so(&#43;0xa95e)[0x7f5cb2af695e]<br>
</div>
<div>/usr/lib64/glusterfs/6.5/xlator/features/shard.so(&#43;0xaf8d)[0x7f5cb2af6f8d]<br>
</div>
<div>/usr/lib64/glusterfs/6.5/xlator/features/shard.so(&#43;0xb3b3)[0x7f5cb2af73b3]<br>
</div>
<div>/usr/lib64/glusterfs/6.5/xlator/features/shard.so(&#43;0xba42)[0x7f5cb2af7a42]<br>
</div>
<div>/lib64/libglusterfs.so.0(&#43;0x61170)[0x7f5cc272f170]<br>
</div>
<div>/lib64/libc.so.6(&#43;0x49e00)[0x7f5cc0d18e00]<br>
</div>
<div>---------<br>
</div>
<span></span></div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12pt; color:rgb(0,0,0)">
<br>
</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12pt; color:rgb(0,0,0)">
The error is consistent and reproducible.&nbsp; Every time I remount and try and delete the client crashes again.&nbsp; I'm assuming something is wrong with the shards.&nbsp; How do I correct this, or is this a bug with sharding?<br>
</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12pt; color:rgb(0,0,0)">
<br>
</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12pt; color:rgb(0,0,0)">
Thanks!</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12pt; color:rgb(0,0,0)">
Tim<br>
</div>
</div>
</body>
</html>