Im Zeitalter der künstlichen Intelligenz ist die Bedeutung von Daten unbestreitbar. Daten sind die Grundlage für große AI-Modelle, und die Qualität der Trainingsdaten bestimmt die Fähigkeiten der AI sowie die Benutzererfahrung des Produkts. Internet-Technologiegiganten, die über große Mengen an multidimensionalen Geschäftsdaten verfügen, haben Szenario-Vorteile. Durch die Datenakkumulation über Jahre im Betrieb von Internetplattformen und die bestehenden Nutzungsszenarien der Benutzer können sie eine große Menge an privaten Daten generieren, was ihnen einen klaren Vorteil in der Optimierung des Modelltrainings verschafft.
Nachdem die frühen AI-Produkte auf den Markt kamen, optimierten sie ihre Modelle durch das Feedback ihrer Benutzerbasis und die Interaktion mit dem Produkt, was einen Datenfliegen-Effekt erzeugte und eine kontinuierliche Optimierung und Iteration ermöglichte. Dies wird später zum Schutzgraben der AI-Produkte. Start-ups im AI-Bereich haben jedoch Schwierigkeiten, eine ausreichende Menge an qualitativ hochwertigen Datenquellen für das Training ihrer Modelle zu finden. Diese Datenbarrieren und die Bildung von Dateninseln werden die Entwicklung der künstlichen Intelligenz behindern.

VANA: Dateninseln aufbrechen, den Nutzern den Wert der Daten teilen.
In den frühen Tagen des Internets blühten viele Internetunternehmen auf, die traditionell betriebene Geschäftsmodelle revolutionierten. Mit der Entwicklung der Branche begannen jedoch führende Internettechnologieunternehmen, den Markt zu monopolisieren, und große Internetplattformen kontrollieren die Datenströme und besitzen eine große Menge an Nutzerdaten. Führende Plattformen können diese Nutzerdaten zur algorithmischen Empfehlung und für die Kreditvergabe nutzen, um kommerziellen Wert zu schöpfen. Reddit hat durch den Verkauf von nutzergenerierten Inhalten als AI-Trainingsdaten 200 Millionen Dollar eingenommen, aber die Nutzerdatenproduzenten haben keinen Anteil an dem Wert und den Ergebnissen dieser Daten. VANAs Auftreten wird die Dateninseln aufbrechen und den Nutzern das Eigentum an den Daten geben, sodass sie die Datengewinne teilen können.
VANA ist ein offenes und dezentrales Datenhoheitsprotokoll. Als EVM-kompatibles L1 ermöglicht VANA den Benutzern, ihre eigenen Daten zu besitzen und persönliche Daten beizutragen, um die Erträge aus der künstlichen Intelligenz zu teilen.
VANA löst das Problem der Quellen für Trainingsdaten von AI-Modellen.
Es ist allgemein bekannt, dass die AI-Modell-Trainingsdaten der Internet-Technologieunternehmen hauptsächlich durch Web-Scraping, kostenpflichtige Käufe und eigene Geschäftsdaten generiert werden. Der Vorteil von Web-Scraping-Daten liegt in der leichten Beschaffung, aber die Datenqualität ist niedrig und die Bereinigung ist schwierig. Kostenpflichtige Daten sind stark homogen, da es aufgrund des Wettbewerbs in der Branche nur wenige wirklich wertvolle Geschäftsdatenquellen gibt. Diese Daten sind schwer zu nutzen, um AI-Modelle differenzierend zu gestalten. Geschäftsdaten, die aus Nutzungsszenarien stammen, haben einen hohen Wert, sind aber für kleine Start-ups nicht freundlich.
VANAs Daten stammen von den Beiträgen der Benutzer im Ökosystem. Benutzer, die an VANA teilnehmen, tragen soziale Medien- oder IoT-Daten wie X und LinkedIn zum DataDAO bei. Diese Daten werden sicher offline gespeichert. Nach der Validierung und Bereinigung werden die Daten zur Entwicklung von AI-Modellen verwendet. Benutzer, die Daten beitragen, erhalten das Governance-Recht im DataDAO, um die Verwendung der Daten zu bestimmen und den Wert der Daten zu teilen.
VANA-Modellvorteile
Durch die Verwendung eines dezentralen Governance-Modells erhalten die Benutzer das Eigentum an den Daten und können selbst entscheiden, wie diese verwendet werden.
Benutzer können über VANA in handelbare Datenvermögen umgewandelt werden, die für dezentrale künstliche Intelligenz-Anwendungen genutzt werden können.
Durch den Einsatz von Zero-Knowledge-Proofs (ZKP) und Trusted Execution Environments (TEE) wird die Datensicherheit und -privatsphäre gewährleistet.
VANA-Netzwerkstruktur
Die Teilnehmer von VANA umfassen hauptsächlich Datenanbieter, Validatoren, Staker, Datenverbraucher sowie DLP (Data Liquidity Pool Creator), also DataDAOs.

1. Datenanbieter
Teilnehmende Benutzer können ein DataDAO im VANA-Netzwerk gründen und ihre Daten beitragen. Die eingereichten Daten werden offline gespeichert, der Nachweis des Beitrags wird on-chain gespeichert. Am Beispiel des ChatGPT DataDAO, Benutzer fordern OpenAI per E-Mail auf, ihre ChatGPT-Daten zu exportieren, und laden die Daten und den Download-Link über gptdatadao.org hoch, nachdem sie eine E-Mail-Antwort erhalten haben.

2. DataDAO
Durch die Staking von VANA im Wert von mindestens 100 US-Dollar kann ein registriertes DataDAO erstellt werden. Nach der Registrierung wird das DataDAO in DataHub angezeigt, damit Datenanbieter es auswählen können. Um die nachhaltige Entwicklung von DataDAO zu fördern, wird VANA den besten 16 DataDAOs, die VANA staken, Anreize bieten. Die Staking-Prämien für die ersten drei Jahre betragen 15 % der Gesamtmenge an Tokens, jeder Belohnungszeitraum beträgt 21 Tage, und das Entsperren des Stakings benötigt 7 Tage. Die Anzahl der VANA-Belohnungen wird durch die Anzahl des gestakten VANA, die Staking-Dauer und die Anzahl der Belohnungen, die das DataDAO erhält, bestimmt. DataDAOs müssen mindestens 10.000 VANA staken, um die Chance auf eine Belohnung zu haben. 50 % der Belohnungen gehören fest den Stakern, die verbleibenden Belohnungen werden vom DataDAO entschieden, ob und wie sie verwendet werden.
Bislang wurden 17 DataDAOs registriert, darunter Volara, das sich auf Twitter/X-Daten konzentriert, R/DataDAO von Reddit und DLP Labs mit LinkedIn-Lebenslaufdaten. Es haben sich bereits 140.000 Reddit-Nutzer R/DataDAO angeschlossen, und das erste von Nutzern besessene AI-Modell wurde bereits trainiert.
3. Validatoren
Validatoren sind verantwortlich für die Sicherheit, Integrität und Funktionalität der Vana Layer 1-Blockchain und stellen sicher, dass Datentransaktionen korrekt validiert, aufgezeichnet und zur Blockchain hinzugefügt werden. Dazu gehören hauptsächlich L1-Validatoren und Satya-Validatoren.
L1 Validatoren sind für die Sicherheit und den Konsens von VANA verantwortlich. Um L1-Validatoren zu werden, müssen mindestens 35.000 VANA gestakt werden. Die anfänglichen L1-Validatoren betragen 64, und später werden sie auf 128 erweitert. Jeder Block bringt 5 VANA, und bei Ausfall wird eine Strafe von 10 % verhängt. Die Belohnung verringert sich jährlich um 10 %.
Satya Validators bieten eine vertrauenswürdige Ausführungsumgebung (TEE), um die von Benutzern beigetragenen Daten zu validieren und die Sicherheit und Privatsphäre des Validierungsprozesses zu gewährleisten. Dadurch erhalten sie VANA-Belohnungen.
4. Datenverbraucher
Entwickler von AI-Modellen wählen als Datenverbraucher geeignete Datensätze aus, um die Anforderungen an die AI-Modellentwicklung zu erfüllen, und nutzen die Infrastruktur von VANA für das AI-Training und die Datenanalyse, um mit DataDAO zusammenzuarbeiten und AI-Modelle zu optimieren.

Am Beispiel des ChatGPT DataDAO werden die hochgeladenen Download-Links und Datendateien verschlüsselt an die Satya Validators übertragen. Die Satya Validators entschlüsseln die Daten und führen eine Überprüfung durch, um die Authentizität der hochgeladenen Daten sicherzustellen und sicherzustellen, dass sie nicht manipuliert wurden.
Anwendungsszenarien und Wirtschaftsmodell des VANA-Tokens
1. Validatoren staken VANA, um die Netzwerksicherheit und die Validierung der Daten zu gewährleisten und erhalten VANA-Belohnungen.
2. VANA wird als Gas für On-Chain-Operationen wie die Ausführung von Verträgen und Interaktionen mit DataDAOs verwendet.
3. Benutzer staken VANA im DataDAO, um Staking-Belohnungen in VANA zu erhalten.
4. Die Datenverbraucher verwenden standardmäßig VANA beim Zugriff auf Daten.
5. VANA-Halter beteiligen sich an der Governance und stimmen über Vorschläge ab. VANA dient als Haupthandelspaar für die von DataDAO ausgegebenen Tokens.

Die maximale Gesamtmenge von VANA beträgt 120 Millionen. Die Token-Verteilung ist in der folgenden Grafik dargestellt.


Gemeinschaft
Umfasst hauptsächlich die Belohnungen für hochwertige Datenbeiträge von DataDAO, Airdrops für frühe Benutzer sowie Entwickler. Bei der TGE werden 20,3 % VANA bereitgestellt, ohne Sperrfrist.
Ecosystem-Ökosystem
Umfasst hauptsächlich die Token, die von DataDAO ausgegeben werden, Blockbelohnungen und Partner. Bei der TGE werden 4,8 % VANA bereitgestellt, ohne Sperrfrist.
Investoren
Vana hat insgesamt 25 Millionen Dollar an Finanzierungen erhalten, darunter 5 Millionen Dollar an strategischer Finanzierung in der Runde von Coinbase Ventures, 18 Millionen Dollar in der A-Runde von Paradigm und 2 Millionen Dollar in der Seed-Runde von Polychain.
Kernbeitragsleister - Kernentwicklungsteam
Zusammenfassend beträgt das gesamte Umlaufangebot von VANA zum Zeitpunkt der TGE 30 Millionen, einschließlich 4,8 Millionen VANA aus dem Binance Launchpool.

Die rechtlichen Risiken des VANA-Modells, falls es in China existiert.
Das dezentrale AI-Modell-Datenprojekt VANA löst die Datenproblematik beim Training von AI-Modellen kostengünstiger, sodass Unternehmer von AI-Modellen über hochwertige Trainingsdaten verfügen können. Es bricht die Dateninseln, die von großen Internetunternehmen geschaffen wurden, und ermöglicht es Tencent, Alibabas Nutzerdaten zu nutzen, um AI-Modelle zu trainieren. Dies senkt die Einstiegshürden für Einzelpersonen und Unternehmen, die sich der AI-Modellentwicklung widmen. Allerdings könnte dieses Modell in China Risiken im Hinblick auf den Export von Daten mit sich bringen.
Die nationale Internetinformationsbehörde hat in den (Richtlinien für die Sicherheitsbewertung des Datenexports (1. Ausgabe)) ausdrücklich festgelegt, dass Datenexportverhalten Folgendes umfasst:
(1) Die Datenverarbeiter werden Daten, die sie im Inland sammeln und erzeugen, ins Ausland übertragen und speichern.
(2) Die von den Datenverarbeitern gesammelten und erzeugten Daten werden im Inland gespeichert. Ausländische Institutionen, Organisationen oder Einzelpersonen können sie abfragen, abrufen, herunterladen oder exportieren.
(3) Andere durch die nationale Internetinformationsbehörde festgelegte Verhaltensweisen bezüglich des Datenexports.
(Gesetz über den grenzüberschreitenden Personenverkehr der Volksrepublik China) Artikel 89 definiert den Auslandsaufenthalt als den Weg von China zum anderen Land oder Gebiet, von China zur Sonderverwaltungsregion Hongkong, zur Sonderverwaltungsregion Macau oder von Festlandchina nach Taiwan. Damit wird deutlich, dass die Beurteilung, ob ein Auslandsaufenthalt vorliegt, auf der Grundlage der gerichtlichen Zuständigkeit erfolgt.
Die Gründung von DataDAOs und die Datenbeiträge der Benutzer unterliegen keinen Beschränkungen. Datenverbraucher müssen keine KYC-Verfahren durchlaufen und können auf die gesammelten Daten zugreifen, solange sie VANA bezahlen. In diesem Fall könnte die Teilnahme von Nutzern aus dem Inland an verschiedenen DataDAOs, die soziale Medien- und Lebenslaufdaten beitragen, möglicherweise den Datenexport betreffen.
Definition personenbezogener Daten: Nach Artikel 76 des (Gesetzes über die Cybersicherheit der Volksrepublik China) sind personenbezogene Daten alle Informationen, die elektronisch oder auf andere Weise aufgezeichnet werden und die eine natürliche Person identifizieren können, entweder allein oder in Kombination mit anderen Informationen. Dazu gehören unter anderem Name, Geburtsdatum, Personalausweisnummer, biometrische Informationen, Adresse, Telefonnummer usw.
Die von DataDAO gesammelten Lebensläufe und Gesundheitsdaten enthalten möglicherweise persönliche Informationen wie Namen, Geburtsdaten, Telefonnummern und sogar sensible persönliche Informationen. (Gesetz über den Schutz personenbezogener Daten der Volksrepublik China) Es gibt Einschränkungen für die Nutzung dieser Daten und für grenzüberschreitende Übertragungen.
