W zeszłym miesiącu uczestniczyłem w rozmowie z zmęczonym liderem IT. Znasz ten typ. Spokojny głos, ciemne kręgi pod oczami, za dużo otwartych kart. Powiedział: „Kopie zapasowe są w porządku.” Potem się zatrzymał. Długa przerwa. „Ale nie ufam im. Tak naprawdę.”
Ta linia przykuwa uwagę. Ponieważ w dużych firmach kopie zapasowe nie są „miłym dodatkiem”. To rzecz, o którą modlisz się, że nigdy nie będzie potrzebna… aż do dnia, w którym będziesz jej potrzebować. A w tym dniu nikt nie martwi się, jak tanie było przechowywanie. Martwią się o jedną rzecz. Czy możemy przywrócić, szybko, i czysto, i udowodnić, co się stało?
Więc gdzie pasuje Walrus (WAL) w tę bardzo nieatrakcyjną rzecz zwaną kopią zapasową?
Walrus to system przechowywania danych stworzony dla dużych kawałków danych, takich jak pliki, logi, obrazy i kopie zapasowe. Ludzie nazywają je „blobami”, co jest zabawnym słowem, ale po prostu oznacza „duży kawałek pliku”. Walrus rozprzestrzenia te kawałki na wielu węzłach przechowywania.
Działa to w sposób, który może przetrwać niektóre węzły offline. Pomyśl o tym jak o rozdzieraniu zdjęcia na wiele kawałków puzzli, a następnie przechowywaniu dodatkowych kawałków w innych szufladach. Jeśli jedna szuflada się spali, nadal możesz odbudować zdjęcie z tego, co zostało. Ten trik odbudowy często nazywa się „kodowaniem erasure”, ale w prostych słowach oznacza: podzielić dane, dodać kawałki bezpieczeństwa i przechowywać szeroko, aby można było je odzyskać.
Teraz, jeśli jesteś przedsiębiorstwem, możesz usłyszeć to i pomyśleć: „Fajnie... ale jak mogę to wykorzystać, nie łamiąc całego mojego ustawienia?” Sprawiedliwe. Nie wyrzucasz swoich starych narzędzi. Nie stawiasz swojej pracy na nowym stosie w jeden tydzień. Poruszasz się krokami, jakbyś przechodził przez rzekę po kamieniach.
Pierwszy kamień jest prosty: traktuj Walrus jako drugą kopię, a nie pierwszą. Trzymaj swoje główne kopie zapasowe tam, gdzie już są. Na miejscu, w chmurze, cokolwiek ufasz dzisiaj. Następnie dodaj Walrus jako dodatkową warstwę dla kopii zapasowych, które już robisz. Nie wszystkie z nich. Zacznij od kopii zapasowych, które możesz sobie pozwolić przetestować. Jak zestawy archiwów tygodniowych, stare logi lub zimne dane, które przechowujesz „na wszelki wypadek”. To jest droga o niskim ryzyku.
I wybierasz jeden zespół. Jedna aplikacja. Jeden zbiór danych. Jeśli spróbujesz to zrobić „na całym przedsiębiorstwie” w dniu pierwszym, dostaniesz spotkania, strach i opóźnienia. Pilot potrzebuje ścisłego celu. Przykład: „Przechowamy 30 dni zrzutów bazy danych oraz przywrócimy jeden pełny zrzut co tydzień z Walrus.” To wszystko. Jeden jasny cel. Jedna rzecz, którą możesz zmierzyć. Prędkość przywracania. Sprawdzanie danych. Ludzki ból.
Druga kamień zapewnia, że Walrus pasuje do twoich zasad, a nie odwrotnie. Backup to nie tylko przechowywanie. To klucze, dostęp, dowody i czas.
Klucze są ważne, ponieważ jeśli stracisz klucze, tracisz dane. Proste jak to. Więc decydujesz na początku, kto trzyma klucze i jak je rotuje. W prostych słowach, rotacja oznacza, że zmieniasz klucze według harmonogramu, aby jedna nieszczelność nie trwała wiecznie. Decydujesz również, jak działa dostęp do przywracania. Nie chcesz, aby każdy deweloper mógł pobrać pełną kopię zapasową o 2 w nocy bez żadnego zapisu. Tak zaczyna się kłopot.
Potem jest integralność. To słowo brzmi poważnie, ale oznacza „czy ten plik jest tym samym plikiem, który napisaliśmy?” Kopie zapasowe zawodzą w cichy sposób. Bit się zmienia. Plik jest przerywany. Proces kłamie. Dlatego twój plan musi mieć kontrole. Hashe są tu powszechne. Hash jest jak krótki odcisk palca pliku. Jeśli odcisk palca się zmienia, plik się zmienia. Przechowujesz ten odcisk palca w bezpiecznym miejscu i porównujesz go podczas przywracania.
A czas jest prawdziwym szefem. Przedsiębiorstwa żyją według dwóch zegarów. Ile danych możemy stracić i jak szybko musimy się odzyskać? Ludzie nazywają to RPO i RTO, ale nie będę rzucać literami. Po prostu pamiętaj: „Jak daleko możemy spaść?” i „Jak szybko możemy wstać?” Walrus może pomóc w części „wstania”, jeśli twoja ścieżka przywracania jest zaplanowana. Jeśli nie planujesz przywracania, nie masz kopii zapasowej. Masz przechowywanie. Duża różnica.
Trzeci kamień to część, którą większość zespołów pomija, ponieważ jest nudna. Ćwiczenia przywracania. Tak, ćwiczenia. Jak ćwiczenia przeciwpożarowe, ale dla danych. Planować je. Robić je nawet wtedy, gdy wszystko jest spokojne. Wybierasz losowe zestawy kopii zapasowych i przywracasz je do przestrzeni testowej. Weryfikujesz, czy aplikacja się uruchamia. Weryfikujesz, czy użytkownicy mogą się zalogować. Weryfikujesz, czy dane wyglądają poprawnie. Następnie zapisujesz, co się zepsuło i naprawiasz to. Tak backup staje się rzeczywisty.
I obserwujesz koszty w prosty sposób. Nie „rozmowy o tokenach”. Tylko koszt za przechowywaną kopię, koszt za przywracanie i koszt czasu pracy personelu. Jeśli proces oszczędza godziny, to jest wartość. Jeśli dodaje godziny, to jest dług. WAL, token może być częścią projektu systemu, ale plan przedsiębiorstwa wskazuje na głębszą prawdę: adopcję wygrywają zespoły operacyjne, a nie wykresy.
Jeszcze jedna rzecz, i to jest moja opinia. Najlepsza oferta dla przedsiębiorstwa to nie „nowa technologia”. To „mniej paniki”. Walrus powinien być przedstawiony jako spokojna warstwa. Szeroka siatka bezpieczeństwa dla kopii zapasowych, którym już ufasz. Sposób na zmniejszenie ryzyka jednego dostawcy. Sposób na dodanie jeszcze jednych drzwi ewakuacyjnych.
Jeśli chcesz to wypróbować, zrób jeden mały pilotaż w tym tygodniu. Wybierz jeden zbiór danych. Zdefiniuj jeden test przywracania. Uruchom go. Potem powiedz mi, co zawiodło najpierw: przesyłanie, obsługa kluczy czy prędkość przywracania?
\u003cm-43/\u003e\u003ct-44/\u003e\u003cc-45/\u003e\u003ct-46/\u003e\u003ct-47/\u003e


