Es šobrīd skatos uz OpenLedger, un arvien vairāk saprotu, ka īstā problēma nav "vai ir dati", bet gan vai augstas kvalitātes dati vispār varēs ienākt. Daudzi AI projekti runā par datu tīklu, datu ieguldījumiem, datu monetizāciju, bet, atklāti sakot, jo vērtīgāki ir dati, jo mazāk tie parasti tiek publiskoti. Uzņēmumu iekšējās zināšanu bāzes, finanšu risku dati, medicīnas paraugi, lietotāju uzvedības ieraksti, tirdzniecības stratēģiju žurnāli – šie nav parasti kopienas uzdevumu dati, kurus varētu vienkārši izmest publiskajā tīklā visiem redzēt. Bet šeit ir problēma: ja šie dati neienāks, AI modeļiem būs grūti patiešām attīstīties; ja šie dati tiek publiskoti, uzņēmumi vienkārši neuzdrošinās piedalīties.
Tāpēc es uzskatu, ka OpenLedger ir vērts pievērst uzmanību grūtajam jautājumam - privātajiem Datanets. Šis virziens nav vienkārši par datu slēpšanu, un tas nav tikai par privātuma aizsardzību, bet par to, lai risinātu 'dati ir pieejami, bet neredzami' jautājumu. Uzņēmumi vēlas, lai viņu dati piedalītos modeļa apmācībā, novērtēšanā vai izdarīšanā, un viņi vēlas, lai ieguldījumi tiktu ierakstīti, atribūti piešķirti un norēķini veikti, bet viņi nevēlas, lai oriģinālie dati būtu atklāti. OpenLedger, ja var padarīt metadatus, ieguldījumu ierakstus un atribūtu rezultātus redzamus, vienlaikus saglabājot oriģinālos sensitīvos materiālus privātus, tad tam ir iespēja patiešām piesaistīt B puses augstas kvalitātes datus.
Šī atšķirība ir ļoti svarīga. Iepriekš mēs runājām par Datanets, vairāk koncentrējoties uz to, kā parasti ieguldītāji ievieto datus tīklā un pēc tam saņem atlīdzību. Bet uzņēmumu scenārijs ir pilnīgi atšķirīgs. Uzņēmumi neaug datus, lai saņemtu dažas atlīdzības, viņi vairāk rūpējas par riskiem, atbilstību, robežām un kontroli. Piemēram, vai finanšu iestāde ir gatava sniegt vēsturiskos riska paraugus, nenoteiks atlīdzības augstums, bet gan tas, vai dati var tikt nopludināti, vai lietošanas apjoms ir kontrolējams, kā tiek sadalīti ieņēmumi pēc modeļa apmācības un vai ir iespējams izsekot problēmas gadījumā. Ja OpenLedger risina tikai jautājumu 'kurš ir sniedzis datus', tas nav pietiekami; tam ir jārisina arī jautājums 'vai oriģinālie dati ir droši pēc ieguldījuma'.
Tas ir arī iemesls, kāpēc privātie Datanets var kļūt par galveno ieeju. Tas ļauj uzņēmumiem pārvērst sensitīvos datus par aktīviem, kas var piedalīties AI tīklā, bet nav nepieciešams atklāt visus oriģinālos materiālus. Šeit var būt iesaistīta šifrēta aprēķināšana, piekļuves tiesības, federētā mācīšanās, droša izpildes vide, pat tikai pierādījumi un indeksēšana, kas tiek novietoti blokķēdē. Parastajiem mazajiem investoriem nav jāizprot katrs tehniskais sīkums, tikai jāapzinās viens - ja OpenLedger vēlas iegūt patiesi augstas kvalitātes datus, tam ir jāpārliecinās, ka datu sniedzēji var tikt atzīti un tajā pašā laikā nezaudē datu kontroli.
Šis skatījums patiesībā ir reālāks nekā vienkārši kliegt 'uzņēmumu dati'. Uzņēmumu dati nav tikai oficiāla sadarbība, kas tiek paziņota, lai uzskatītu, ka viss ir kārtībā; patiesībā ir jāvērtē, vai tie turpina sniegt ieguldījumus, vai tiek izmantoti modeļos, vai tie rada uzņēmuma ienākumus vai uzlabo modeļa efektivitāti. Ja privātie Datanets ir tikai konceptuāls, tad tā nozīme ir ierobežota; ja tie tiešām var ļaut sensitīviem datiem iekļūt modeļa apmācībā un izdarīšanā kontrolētā veidā, tad OpenLedger datu tīkls būs daudz biezāks nekā parastie atvērto datu baseini.
Šeit var pieslēgties tokenu vērtībai. Ja AI datu tīkls balstās tikai uz publiskiem datiem, tas viegli kļūst homogēns un var tikt ietekmēts no viltus darījumiem. Bet, ja uzņēmumu dati var tikt izmantoti, nesniedzot oriģinālo tekstu, un ieguldījumu ieraksti un ieņēmumu sadale var tikt veikta tīklā, tad tokeni var piedalīties vērtīgākos datu pakalpojumos. Piemēram, uzņēmumi sniedz datus, modeļi kļūst spēcīgāki, lietotāji maksā par modeļa izmantošanu, un ieguldītāji saņem atlīdzību saskaņā ar noteikumiem, kamēr infrastruktūra gūst vērtību no reālas lietošanas. Tikai tādā veidā $OPEN nozīme nav vienkārša atlīdzība par kopienas aktivitāti, bet gan iekļaušanās augstākas kvalitātes datu piegādē un modeļa izmantošanas ekonomiskajā ciklā.
Protams, šis ceļš ir grūts. Privātuma aizsardzība nav jautājums, ko var atrisināt ar vienu frāzi, un uzņēmumu dati netiks viegli atklāti tikai tāpēc, ka ir stāsts par AI. OpenLedger ir daudz jautājumu, uz kuriem jāatbild, piemēram, kuri dati var iekļūt privātajos Datanets, kas var piekļūt, kā tiek saglabāta piekļuves vēsture, kā tiek pierādīti ieguldījumi, kā tiek veikti norēķini, ko darīt ar modeļiem, ja dati tiek izņemti vai tiesības tiek mainītas. Šie visi nav īstermiņa mārketinga jautājumi, ko var izskaidrot, tie prasa reālus produktus un reālus gadījumus, lai pakāpeniski pārbaudītu.
Personīgi es uzskatu, ka privātie Datanets ir punkts, kurā novērot, vai OpenLedger var iekļūt reālākās komerciālās ainās. Parastie dati var tikt sākotnēji aktivizēti, bet uzņēmumu sensitīvie dati ir grūtības. AI visvairāk trūkst augstas kvalitātes datu, bet augstas kvalitātes dati nepaliks atklāti. Ja OpenLedger var pierādīt, ka dati, kuri netiek publiskoti, var tikt atzīti, un ka tie var piedalīties modeļa vērtību plūsmā, tad tā projekta loģika būs stiprāka nekā parastajā AI datu stāstā. Savukārt, ja šī kārta nesanāks, tad tā saucamā B puses datu pieprasījuma stāsts viegli paliks tikai stāstā.

