<div dir="ltr"><div>Hello,</div><div><br></div><div>I think the various pieces around infra have stabilized enough for us to think about this. I suggest that we think about having a Gerrit replica in the cloud (whichever clouds the CI consumes). This gives us a fall back option in case the cage has problems. It also gives us a good way to reduce the CI related load on the main Gerrit server. In the near future, when we run distributed testing, we&#39;re going to clone 10x as much as we do now. Right now we clone over git to take the load away from Gerrit, but when we have a replica, I vote we clone over HTTP(s).</div><div><br></div><div>I would also recommend an offsite PostgreSQL replica that will let us be somewhat fault tolerant. In the event that cage has a multi-hour unexplained outage, we&#39;d be able to bring back essential services.</div><div><br></div><div>This is suggestion. We&#39;ll need to estimate the cost of work involved + cost of operating both these hot standbys.<br></div><div><div><br>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr">nigelb<br></div></div></div></div></div>