VANA: Rozbijanie silosów danych i wspomaganie szkolenia modeli AI

W dobie sztucznej inteligencji znaczenie danych jest oczywiste. Dane stanowią podstawę dużych modeli sztucznej inteligencji, a jakość źródeł danych szkoleniowych determinuje możliwości sztucznej inteligencji i doświadczenie użytkownika produktu. Giganci technologii internetowych dysponujący dużą ilością wielowymiarowych danych biznesowych mają przewagę scenariuszową. Dzięki wieloletniemu gromadzeniu danych podczas działania platformy internetowej i istniejącym scenariuszom korzystania z platformy przez użytkowników, można wygenerować dużą ilość prywatnych danych, co ma. oczywiste zalety w uczeniu i optymalizacji modeli.
Po wprowadzeniu na rynek wczesnych produktów AI dostrojenie modeli opiera się na informacjach zwrotnych od własnych grup użytkowników i interakcjach z produktami, co skutkuje efektem koła zamachowego danych oraz ciągłą optymalizacją i iteracją, co w przyszłości stanie się fosą dla produktów AI. Jednak start-upy na ścieżce AI borykają się z niedostateczną ilością i jakością źródeł danych do trenowania modeli. Tego rodzaju bariery danych i powstawanie wysp danych będą utrudniać rozwój sztucznej inteligencji.
VANA: Przełamywanie izolacji danych, użytkownicy dzielą się wartością danych.
Wczesny internet był pełen różnorodnych firm internetowych, które zrewolucjonizowały tradycyjne modele operacyjne, ale później, w miarę rozwoju branży, wiodące firmy technologiczne zaczęły dominować na rynku, a duże platformy internetowe kontrolowały dostęp do ruchu i posiadały ogromne ilości danych użytkowników. Wiodące platformy mogą wykorzystywać te dane do rekomendacji algorytmicznych i kredytów, generując wartość komercyjną. Reddit uzyskał 200 milionów dolarów, sprzedając treści generowane przez użytkowników jako dane do trenowania AI, ale użytkownicy, którzy generują dane, nie dzielą się wartością i korzyściami płynącymi z tych danych. Pojawienie się VANY ma na celu przełamanie izolacji danych, dając użytkownikom kontrolę nad danymi i dzieląc się zyskami z danych.
VANA to otwarty i zdecentralizowany protokół suwerenności danych, jako EVM-kompatybilny L1, VANA umożliwia użytkownikom posiadanie własnych danych, wnosić dane osobowe i dzielić się zyskami z AI.
VANA rozwiązuje problem źródeł danych do treningu modeli AI.
Jak powszechnie wiadomo, dane do treningu modeli AI w firmach technologicznych pochodzą głównie z web scrapingu, płatnych zakupów oraz z gromadzenia danych własnych. Dane pozyskiwane z web scrapingu są łatwe do zdobycia, ale mają niską jakość i są trudne do oczyszczenia; dane kupowane są często jednorodne, w wyniku konkurencji komercyjnej jest bardzo mało rzeczywistych wartościowych źródeł danych biznesowych, co sprawia, że takie dane są trudne do wykorzystania, aby uzyskać przewagę różnicującą w modelach AI; dane gromadzone w kontekście działalności mają wysoką wartość, ale ta metoda nie jest przyjazna dla małych firm i startupów.
Natomiast dane VANY pochodzą z wkładu użytkowników w ekosystemie. Użytkownicy biorący udział w ekosystemie VANA dostarczają dane z mediów społecznościowych, takich jak X, LinkedIn, lub z danych IoT. Te dane będą bezpiecznie przechowywane poza łańcuchem. Po weryfikacji i oczyszczeniu dane zostaną zastosowane w rozwoju modeli AI. Użytkownicy, którzy przyczyniają się do danych, mogą uzyskać prawo do zarządzania DataDAO, decydując o prawie do korzystania z danych oraz dzieląc się wartością generowaną przez dane.
Zalety modelu VANA
Przy użyciu zdecentralizowanego modelu zarządzania, użytkownicy mają prawo do posiadania danych i samodzielnie decydują o sposobie ich wykorzystania.
Użytkownicy mogą przekształcać VANA w wymienne aktywa danych, które mogą być używane w aplikacjach sztucznej inteligencji.
Dzięki zastosowaniu dowodów zerowej wiedzy (ZKP) i zaufanego środowiska wykonawczego (TEE), zapewniana jest prywatność i bezpieczeństwo danych.
Struktura sieci VANA
Uczestnicy VANY obejmują głównie wkładców danych, walidatorów, stakujących, konsumentów danych oraz DLP (Twórca Puli Płynności Danych), a więc DataDAO.
1. Wkładcy Danych
Uczestnicy mogą wybierać DataDAO utworzone w sieci VANA, aby wnosić swoje dane. Złożone dane są przechowywane poza łańcuchem, a dowody wkładu są przechowywane na łańcuchu. Na przykład w przypadku ChatGPT DataDAO użytkownicy mogą zażądać od OpenAI eksportu danych ChatGPT, a po otrzymaniu odpowiedzi e-mailowej przesłać dane i link do pobrania na gptdatadao.org.
2. DataDAO
Zdeponowanie co najmniej 100 dolarów wartości VANA pozwala na utworzenie zarejestrowanego DataDAO. Po zakończeniu rejestracji DataDAO pojawi się na DataHub, aby użytkownicy mogli wybrać. Aby wspierać rozwój DataDAO, VANA przyzna nagrody za staking dla 16 najlepszych DataDAO. W ciągu pierwszych trzech lat nagrody za staking będą wynosić 15% całkowitej ilości tokenów, a cykl nagród trwa 21 dni. Odblokowanie stakowania wymaga 7 dni. Liczba nagród VANA zależy od ilości stakowanych tokenów, czasu stakowania oraz liczby nagród, które DataDAO otrzyma. DataDAO musi zablokować co najmniej 10 000 VANA, aby mieć szansę na uzyskanie nagród. 50% nagród jest na stałe przypisane do stakujących, a pozostałe nagrody są decydowane przez DataDAO.
Obecnie zarejestrowano 17 DataDAO, w tym Volara, koncentrująca się na danych Twitter/X, R/DataDAO związane z Reddit oraz DLP Labs, które zajmują się danymi z LinkedIn. Już 140 000 użytkowników Reddit dołączyło do R/DataDAO, a pierwszy model AI stworzony przez użytkowników został już wytrenowany.
3. Walidatorzy
Walidatorzy są odpowiedzialni za bezpieczeństwo, integralność i funkcjonalność łańcucha blokowego Vana Layer 1, zapewniając, że transakcje danych są prawidłowo weryfikowane, rejestrowane i dodawane do łańcucha blokowego, w tym głównie walidatorzy L1 i walidatorzy Satya.
Walidatorzy L1 odpowiadają za bezpieczeństwo i konsensus VANY. Minimalne stakowanie to 35 000 VANA, początkowa liczba walidatorów L1 wynosi 64, z późniejszym rozszerzeniem do 128. Za każdy blok przyznawane jest 5 VANA, a awaria skutkuje karą w wysokości 10%, nagrody zmniejszają się co roku o 10%.
Walidatorzy Satya zapewniają zaufane środowisko wykonawcze (TEE) do weryfikacji danych wniesionych przez użytkowników, zapewniając bezpieczeństwo i prywatność procesu weryfikacji. W ten sposób można uzyskać nagrody VANA.
4. Konsumenci Danych
Deweloperzy modeli AI jako konsumenci danych wybierają i kupują dostęp do zestawów danych, które odpowiadają ich potrzebom w zakresie rozwoju modeli AI, wykorzystując infrastrukturę VANA do treningu AI i analizy danych, współpracując z DataDAO w celu optymalizacji modeli AI.
Na przykład w przypadku ChatGPT DataDAO, użytkownicy przesyłają linki do pobrania i pliki danych, które są przesyłane zaszyfrowane do Walidatorów Satya. Po odszyfrowaniu przez Walidatorów Satya, dane są weryfikowane, aby upewnić się, że przesłane dane są prawdziwe i nie zostały zmienione.
Scenariusze zastosowania i model ekonomiczny tokena VANA
1. Walidatorzy stakują VANA, aby zapewnić bezpieczeństwo sieci i weryfikować dane, za co otrzymują nagrody VANA.
2. VANA jako gaz do wykonywania kontraktów w sieci oraz interakcji z DataDAO.
3. Użytkownicy stakują VANA w DataDAO, aby uzyskać nagrody za staking VANA.
4. Konsumenci Danych domyślnie korzystają z VANA podczas uzyskiwania dostępu do danych.
5. Posiadacze VANA uczestniczą w zarządzaniu i głosują nad propozycjami, VANA jest główną parą handlową dla tokenów wydawanych przez DataDAO.
Całkowita podaż VANA wynosi 120 milionów, przydział tokenów przedstawiony jest na poniższym wykresie.
Społeczność
Głównie obejmuje nagrody za wysokiej jakości wkłady danych do DataDAO, a także airdropy dla wczesnych użytkowników oraz nagrody dla deweloperów. TGE dostarcza 20,3% VANA, bez okresu blokady.
Ekosystem
Głównie obejmuje tokeny wydawane przez DataDAO, nagrody blokowe oraz partnerów, TGE dostarcza 4,8% VANA, bez zamrożenia.
Inwestorzy
Vana uzyskała dotychczas 25 milionów dolarów finansowania, w tym 5 milionów dolarów od Coinbase Ventures w rundzie strategicznej, 18 milionów dolarów w rundzie A od Paradigm oraz 2 miliony dolarów w rundzie seed od Polychain.
Główne Wkłady
Podsumowując, całkowita podaż VANA w momencie TGE wynosi 30 milionów, w tym 4,8 miliona VANA z Binance Launchpool.
Ryzyko prawne modelu VANA, jeśli istnieje w Chinach
Projekt danych modeli AI VANA w sposób zdecentralizowany rozwiązuje problemy związane z treningiem modeli AI przy niższych kosztach, umożliwiając przedsiębiorcom modeli AI dostęp do wysokiej jakości danych treningowych, przełamując izolację danych stworzonych przez duże przedsiębiorstwa internetowe. To stwarza możliwość pozyskania danych użytkowników Alibaby przez Tencent do trenowania modeli AI, obniżając próg wejścia dla osób i firm zajmujących się tworzeniem modeli AI, ale taki model może wiązać się z ryzykiem wywozu danych w Chinach.
Krajowy Urząd ds. Cyberprzestrzeni opublikował (Wytyczne w zakresie oceny bezpieczeństwa wywozu danych (Wersja 1)), w których wyraźnie stwierdzono, że działania związane z wywozem danych obejmują:
(1) Przetwórcy danych będą przesyłać i przechowywać zebrane dane w kraju za granicą;
(2) Dane przetwarzane i generowane przez przetwórców danych są przechowywane w kraju, a instytucje, organizacje lub osoby z zagranicy mogą je przeglądać, pobierać, ściągać i eksportować.
(3) Inne działania związane z wywozem danych, określone przez Krajowy Urząd ds. Cyberprzestrzeni.
(Ustawa o zarządzaniu wjazdem i wyjazdem z terytorium Chin) Artykuł 89 wyraźnie określa, że wyjazd oznacza podróż z kontynentu Chin do innych krajów lub regionów, do Specjalnego Regionu Administracyjnego Hongkongu, Specjalnego Regionu Administracyjnego Makau, lub na Tajwan. Z tego wynika, że ocena, czy doszło do wyjazdu, opiera się na jurysdykcji sądowej.
Tworzenie DataDAO oraz wkład danych przez użytkowników nie ma żadnych ograniczeń, konsumenci danych nie muszą przeprowadzać KYC, wystarczy, że zapłacą VANA, aby uzyskać dostęp do zbieranych danych. W tej sytuacji uczestnictwo krajowych użytkowników w różnych DataDAO dostarczających dane z mediów społecznościowych, CV, może wiązać się z wywozem danych.
Definicja danych osobowych: Zgodnie z (Ustawą o bezpieczeństwie w sieci Republiki Ludowej Chin) Artykuł 76: dane osobowe to wszelkie informacje, które mogą identyfikować osobę fizyczną, zarówno samodzielnie, jak i w połączeniu z innymi informacjami, w tym m.in. imię, datę urodzenia, numer dowodu osobistego, biometryczne dane osobowe, adres, numer telefonu itp.
Dane zbierane przez DataDAO, takie jak CV, dane zdrowotne, mogą zawierać imiona, daty urodzenia, numery telefonów i inne dane osobowe, w tym wrażliwe informacje osobiste. (Ustawa o ochronie danych osobowych Republiki Ludowej Chin) Reguluje to użycie tych danych oraz ich przesyłanie za granicę.

#币安LaunchpoolVANA