Największym problemem w uczeniu maszynowym jest napotkanie na brudne dane. Trening modelu przez pół dnia może zostać całkowicie zniweczony, gdy źródłowe dane zostaną zmanipulowane. Rozwiązaniem Walrusa jest wykonanie migawki oryginalnego zestawu danych w celu udokumentowania. Każda wersja generuje identyfikator treści (Content ID) wraz z czasem na łańcuchu Sui. Każdy może prześledzić i zweryfikować. Testowałem z zespołem użycie Walrusa do przechowywania zestawu danych ImageNet. Podczas treningu bezpośrednio pobieramy określony CID, co zapewnia dodatkową warstwę zaufania w porównaniu do AWS S3. Jednak prędkość transferu jest rzeczywiście nieco wolniejsza niż w przypadku chmurowego rozwiązania centralnego, zwłaszcza gdy opóźnienia w transatlantyckim wywołaniu są wyraźne. Nadaje się to do scenariuszy badawczych o wysokich wymaganiach dotyczących zaufania. Zastosowania komercyjne muszą poczekać na optymalizację sieci.


WALUSDT
Perp
0.1327
+5.82%