Wir betrachten einen Projekt (Modell) Eigentümer, der ein Modell trainieren möchte, indem er die lokalen privaten Daten und Rechenleistung interessierter Datenbesitzer, d.h. Trainer, nutzt. Unser Ziel ist es, einen Datenmarktplatz für solche dezentralen kollaborativen/föderierten Lernanwendungen zu entwerfen, der gleichzeitig i) eine beitragsbasierte Belohnungsverteilung bereitstellt, sodass die Trainer basierend auf ihren Beiträgen zum trainierten Modell entschädigt werden; ii) datenschutzfreundliches dezentrales Modelltraining ermöglicht, indem jegliche Datenbewegung von Datenbesitzern vermieden wird; iii) Robustheit gegen böswillige Parteien (z.B. Trainer, die das Modell verderben wollen); iv) Überprüfbarkeit im Sinne, dass die Integrität, d.h. Korrektheit, aller Berechnungen im Datenmarktprotokoll einschließlich der Beitragsbewertung und Ausreißererkennung durch Zero-Knowledge-Beweise überprüfbar sind; und v) effizientes und universelles Design. Wir schlagen ein blockchain-basiertes Marktplatzdesign vor, um alle fünf oben genannten Ziele zu erreichen. In unserem Design nutzen wir eine verteilte Speicherinfrastruktur und einen Aggregator neben dem Projekteigentümer und den Trainern. Der Aggregator ist ein Verarbeitungsnode, der bestimmte Berechnungen durchführt, einschließlich der Bewertung der Trainerbeiträge, der Entfernung von Ausreißern und der Aktualisierung von Hyperparametern. Wir führen den vorgeschlagenen Datenmarkt durch einen Blockchain-Smart-Contract aus. Der bereitgestellte Smart-Contract stellt sicher, dass der Projekteigentümer die Zahlung nicht umgehen kann und ehrliche Trainer am Ende des Trainings basierend auf ihren Beiträgen belohnt werden. Schließlich implementieren wir die Bausteine des vorgeschlagenen Datenmarkts und demonstrieren deren Anwendbarkeit in praktischen Szenarien durch umfassende Experimente.
Quelle : chainopera.ai
