Czy wiesz, że największy mit dotyczący kodowania erasure w Walrusie polega na tym, że to po prostu wyrafinowana redundancja, jak proste kopie zapasowe, podczas gdy w rzeczywistości to matematyczna potęga, która dzieli Twoje dane na fragmenty i części parzyste, umożliwiając rekonstrukcję nawet w przypadku awarii do jednej trzeciej węzłów, a wszystko to przy minimalnym narzucie pamięci wynoszącym około 1,5x w porównaniu do 3x nadmiaru pełnej replikacji?
W Walrusie kodowanie erasure działa, kodując blob'y za pomocą algorytmów Reed-Solomon, gdzie oryginalne dane są dzielone na k fragmentów i m fragmentów parzystych, przechowywanych w zdecentralizowanych weryfikatorach Sui i węzłach pamięci, zapewniając, że tak długo, jak k fragmentów jest dostępnych, cały blob może być odzyskany bez potrzeby posiadania całego zestawu, co bezpośrednio zwalcza pojedyncze punkty awarii w tradycyjnej scentralizowanej pamięci.
Ten proces integruje się płynnie z językiem Move Sui do weryfikacji na łańcuchu, gdzie kryptograficzne hashe i dowody potwierdzają integralność danych podczas kodowania i odzyskiwania, zapobiegając manipulacji i umożliwiając efektywne skalowanie dla dużych zbiorów danych takich jak modele treningowe AI, które mogą zajmować gigabajty.
Tokeny WAL odgrywają tutaj kluczową rolę, ponieważ są używane do stakowania węzłów do zadań kodowania, opłacania certyfikacji blobów na łańcuchu oraz zachęcania do uczciwego uczestnictwa poprzez kary za zubożenie, jeśli węzeł nie dostarczy swojego fragmentu podczas wyzwania odzyskiwania, tworząc samowystarczającą gospodarkę, która dostosowuje motywacje operatorów do niezawodności danych.
Na przykład, jeśli tworzysz aplikację AI na Sui, możesz przesłać zestaw danych 10GB za pośrednictwem Walrusa, zakodować go w 30 fragmentach (20 danych + 10 parzystych) rozproszonych w 30 węzłach, a następnie odzyskać go w całości, nawet jeśli 10 węzłów przejdzie w tryb offline, a wszystko to płacąc tylko WAL za początkową certyfikację i minimalne opłaty za pamięć na podstawie cen związanych z epokami.
Jakie konkretne progi awarii węzłów sprawiłyby, że zastanowiłbyś się nad użyciem kodowania erasure zamiast pełnej replikacji w swoim następnym projekcie zintegrowanym z Walrusem?


