Por que o Walrus desafia suposições tradicionais sobre falhas em vez de provedores de nuvem
Quando eu comparei pela primeira vez o Protocolo Walrus com provedores de nuvem tradicionais como AWS ou Google Cloud, notei uma diferença fundamental em como eles abordam a falha. As nuvens assumem que as falhas são raras e as mitigam com redundância interna e rápida troca, visando um tempo de atividade quase perfeito por meio de controle centralizado. O Walrus desafia isso tratando a falha como inevitável em um sistema descentralizado e projetando o protocolo para tolerar e se recuperar dela sem nenhum ponto único de autoridade.
O Walrus opera sob a suposição de que os nós podem falhar, ficar offline ou agir de forma maliciosa a qualquer momento. Em vez de tentar prevenir todas as falhas, ele utiliza o RedStuff, um sistema de codificação de apagamento bidimensional, para codificar blobs em fatias distribuídas entre nós independentes. Isso permite a reconstrução a partir de um subconjunto de fatias, tolerando até um terço de falhas de nós durante a operação normal e dois terços durante a recuperação.