Gribu sākt ar atšķirību, ko gandrīz neviens neizdara.
Ir divas atsevišķas problēmas AI bojātajā datu ekonomikā.
Pirmais problēma ir atribūcija. Kas ieguldīja ko. Kuri datu kopas apmācīja kuri modeļi. Sekojot AI inteliģences izcelsmei atpakaļ līdz tās cilvēku avotiem.
OpenLedger strādā pie šīs problēmas. Atribūcijas pierādījums, datu tīkli, uz ķēdes ieguldījumu ieraksti. Reāla infrastruktūra reālai problēmai.
Bet ir otra problēma. Klusāka. Grūtāka. Gandrīz pilnīgi ignorēta pašreizējā sarunā.
Cenu noteikšana.
Nemaksāt ieguldītājiem - tas ir vienkāršais daļa, kad atribūcija eksistē. Grūtā daļa ir, cik daudz katram ieguldījumam būtu jābūt vērtam?
Šeit ir iemesls, kāpēc tas ir svarīgāk, nekā lielākā daļa cilvēku apzinās.
Iedomājieties trīs datu ieguldītājus AI medicīniskās diagnostikas sistēmā.
Ieguldītājs A augšupielādē 10,000 vispārēju veselības ierakstu. Noderīgi, bet vispārīgi. Šie dati palīdz modelim saprast pamata paraugus.
Ieguldītājs B augšupielādē 500 retu slimību gadījumu pētījumu no specializētas klīnikas. Retas, precīzas, grūti atrodamas citur. Šie dati palīdz modelim identificēt stāvokļus, kurus citādi varētu palaist garām.
Ieguldītājs C augšupielādē 50 ļoti detalizētus ilgtermiņa pacientu pētījumus par retām slimībām, kas veikti 20 gadu laikā. Neaizvietojams. Šie dati fundamentāli maina to, ko modelis var diagnosticēt.
Ja sistēma maksā tikai balstoties uz apjomu, ieguldītājs A saņem visvairāk. Bet ieguldītāja A dati var būt devuši vismazāko faktisko vērtību modeļa svarīgākajiem rezultātiem.
Ja sistēma maksā balstoties uz ietekmi, jums jāizmēra ne tikai tas, vai dati tika izmantoti, bet kā transformējoši tie tika izmantoti. Vai tie virzīja modeļa spējas veidos, kā citādi nekas nevarēja.
Tas ir pilnīgi atšķirīgs mērījumu uzdevums.
Pašreizējās atribūcijas sistēmas, tostarp OpenLedger's Proof of Attribution, galvenokārt risina pirmā līmeņa izmantošanas izsekošanu. Kuri dati ietekmēja kuru rezultātu.
Bet izmantošana nav tas pats, kas vērtības radīšana.
Datu gabals var tikt "izmantojams" tūkstoš reizes veidos, kas gandrīz nemaina situāciju. Cits datu gabals var tikt "izmantojams" vienreiz un fundamentāli mainīt to, ko modelis spēj.
Maksāt vienādi par nevienādu vērtības radīšanu nav godīga atribūcija. Tas ir tikai nedaudz caurredzams nepareizs novērtējums.
Tas ir ekonomiski svarīgi $OPEN in veidā, par kuru neviens nerunā.
Ja OpenLedger's atribūcijas sistēma maksā ieguldītājiem, pamatojoties uz izmantošanas biežumu, nevis vērtības ietekmi, tā rada paredzamu izkropļojumu. Liela apjoma, zemas kvalitātes dati plūst Datanetos, jo tos ir viegli ražot un joprojām maksā. Retu, augstas vērtības, grūti ražojamu datu ieguldījums tiek salīdzinoši nepietiekami kompensēts, jo tā ieguldījumu ir grūtāk izmērīt.
Laika gaitā Datanets piepildās ar troksni. Signāls tiek nospiests. Modeļi, kas apmācīti OpenLedger infrastruktūrā, kļūst mazāk vērtīgi. Izstrādātāju pieņemšana palēninās. Token pieprasījums vājinās.
Tas nav hipotētisks. Tas ir tieši tas dinamisks, kas iznīcināja agrīnās satura platformas Medium, agrīno YouTube, agrīno Substack. Maksājiet vienādi par visiem saturiem un jūs saņemat apjomu pār kvalitāti, līdz kvalitatīvi ražotāji aiziet uz vidēm, kas atzīst viņu faktisko vērtību.
Risinājums nav vienkāršs. Es neizliecos, ka tas ir.
Vērtību sverta atribūcija prasa atbildēt uz jautājumiem, kas ātri kļūst filozofiski neērti.
Kurš nosaka, kuri dati radīja vairāk vērtības? Izstrādātāji, kas veidoja modeli? Lietotāji, kas guva labumu no tā rezultātiem? Kāds automatizēts on-chain mehānisms?
Katrs atbildes veids veido atšķirīgas stimulu struktūras. Katram ir atšķirīgas neveiksmju režīmi.
Bet šeit ir mans godīgais viedoklis.
OpenLedger ir uzbūvējis kaut ko reālu un svarīgu. Proof of Attribution ir patiesa infrastruktūra patiesai problēmai.
Nākamā robeža cenu ieguldījuma vērtība, nevis tikai ieguldījuma eksistences izsekošana, ir vieta, kur sistēma kļūst transformējoša vai paliek interesanta, bet ierobežota.
Atribūcija bez cenu noteikšanas ir grāmatvedības sistēma.
Atribūcija ar cenu ir ekonomika.
Atšķirība starp šiem diviem ir atšķirība starp projektu, kas ir svarīgs ciklam, un tādu, kas ir svarīgs desmitgadei.
Es skatos, lai redzētu, uz kuru virzienu OpenLedger virzās.
Vai domājat, ka datu kvalitāte un datu apjoms jākompensē atšķirīgi? Kā jūs izstrādātu godīgu sistēmu?
