Ragazzi, vi metto subito in chiaro: ora ci sono un sacco di progetti che parlano di "infrastruttura", sembra quasi una riunione di un'impresa di ristrutturazione—i piani sono grandi, ma l'implementazione è in sospeso. @OpenLedger Ultimamente sto tenendo d'occhio questa situazione perché non ama parlare di teorie astratte, ma si sta concentrando su una questione molto concreta: le materie prime per l'addestramento dei modelli—da dove arrivano, chi è responsabile, come vengono tracciate e come vengono regolate. (Priorità alla sicurezza: parlo solo della logica dei meccanismi che vedo, senza fare alcun suggerimento orientato.)


$BTC

La mia comprensione di OpenLedger è piuttosto cruda: vuole estrarre la "catena dei dati" da una scatola nera e trasformarla in un sistema di riconciliazione. Il problema più grande nel settore non era "mancanza di dati", ma il fatto che le fonti dei dati non erano chiare, i confini di autorizzazione non erano ben definiti, l'attribuzione delle contribuzioni non era precisa e, quando si verificavano problemi, nessuno si assumeva la responsabilità. Sembri un materiale di addestramento, e approfondendo si tratta di conformità, copyright, privacy, qualità e una zuppa di regolamenti. Molti team alla fine si cavano d'impiccio con un "abbiamo una collaborazione", ma quando si verifica un problema iniziano a fingersi innocenti.


L'approccio di OpenLedger è più simile a 'distribuire il carico a ciascuno'. Ho notato che sottolineano ripetutamente il concetto chiave: catena di responsabilità dei dati (chi fornisce, chi elabora, chi utilizza, chi verifica) + tracciabilità (ogni passaggio ha una registrazione) + liquidabilità (i contributi possono essere quantificati e riconciliati). Se riescono a fare tutto questo contemporaneamente, allora i dati diventano davvero 'attivi commerciabili e soggetti a revisione', e non solo 'tutti riconoscono verbalmente il tuo valore'.


Mi interessa molto come scomporranno il percorso. Dalla mia attuale osservazione, vogliono almeno suddividere il flusso di dati in alcune 'fasi verificabili':

1) Nodo di origine: da dove proviene il dato, chi detiene i diritti originali, il metodo di raccolta non è in violazione. Se qui non è pulito, tutto il resto è inutile.

2) Nodo di elaborazione: pulizia, etichettatura, strutturazione, molti 'qualità' vengono decisi qui. Se OpenLedger riesce a mettere un'etichetta verificabile sul processo di elaborazione, ciò trasforma la 'qualità di facciata' in 'qualità verificabile'.

3) Nodo di autorizzazione: chi può usare, per quale scopo, per quanto tempo, se può essere redistribuito. In parole povere, si tratta di trasformare 'puoi usare' in 'puoi usare solo in questo modo'.

4) Nodo di utilizzo: chi utilizza i dati in quale task di addestramento e quali effetti incrementali ne derivano (questo è il più difficile, ma anche il più prezioso).

5) Nodo di pagamento: come vengono divisi i contributi, come vengono risolte le controversie. Senza liquidazione, la catena di responsabilità è solo 'software di contabilità'; con liquidazione diventa 'relazione produttiva'.


Lo vedi come se stesse creando tre tabelle: tabella delle fonti, tabella delle autorizzazioni, tabella dei pagamenti. Se le tabelle sono fatte bene, molte controversie diminuiranno della metà. Nella realtà, la cosa più frustrante è: un dato viene trasportato ripetutamente, alla fine tutti dicono 'ero solo di passaggio', e il contributore non ottiene riconoscimento, mentre l'utilizzatore si prende i rischi. Se OpenLedger riesce a implementare il concetto di 'anche chi è di passaggio deve lasciare una ricevuta', il settore ne beneficerà molto.


Certo, è fondamentale considerare i punti di rischio. Penso che il successo di progetti come OpenLedger dipenda da tre ostacoli:




  • Campagna 1: come quantificare la qualitàSe alla fine si riduce a 'chi carica di più decide', diventa una discarica. Ha bisogno di un meccanismo di verifica più rigido; altrimenti, l'attribuzione dei contributi sarà compromessa.



  • Campagna 2: come standardizzare le autorizzazioniLe condizioni di autorizzazione sono troppo complesse, l'ecosistema non può funzionare; troppo semplici, e si rischia di cadere in trappole. Questo equilibrio mette alla prova la capacità ingegneristica del team.



  • Campagna 3: come risolvere le controversieLe registrazioni on-chain non sono onnipotenti, le controversie si presenteranno sicuramente: controversie sulle fonti, controversie sulle etichette, controversie sui diritti d'autore, controversie sui dati duplicati. OpenLedger deve fornire un 'processo di gestione eseguibile', altrimenti quando si presenta un problema, ognuno torna a casa propria.



Ho anche confrontato il progetto con alcune strade che 'fanno solo mercati di dati / solo stoccaggio / solo piattaforme di addestramento': molti progetti risolvono solo una parte, come mettere in vendita i dati, o conservarli, o fornire interfacce per l'addestramento. Ma OpenLedger sembra voler legare responsabilità, tracciabilità e liquidazione in un ciclo chiuso. Il vantaggio di un ciclo chiuso è: non dipendere dalla reputazione, ma parlare con i bilanci; il lato negativo è evidente: è pesante, ci si muove lentamente, ci sono molti dettagli problematici, un minimo cedimento può portare a problemi.


Quindi, ora guardo il progetto sotto una luce molto semplice: non mi interessa molto quale slogan lanciano, mi interessa di più se possono far diventare 'la capacità di riconciliazione del flusso di dati' una configurazione predefinita - per far sì che i contributori siano disposti a dare, gli utilizzatori a utilizzare, e l'ecosistema ad espandersi. Se riescono in questa direzione, il valore non può essere spiegato da un paio di ondate di entusiasmo; se non ci riescono, non forzate, il mercato vi dirà con freddezza che 'i conti non tornano'.


Infine, vorrei concludere: continuerò a monitorare tre cose - se il meccanismo di verifica è diventato più rigoroso, se il sistema di autorizzazione è diventato più fluido, se le regole di liquidazione sono diventate più chiare. Altri aspetti secondari li mettiamo da parte per ora. Ragazzi, non trattate i dati come un buffet gratuito, alla fine, se vi fa male, dovrete comprarvi le medicine.