Tagadējie AI modeļu treniņiem izmantotie dati ir visiem zināmi. Tie ir tie, kas iegūti no interneta bez jebkādas garantijas par komercizmantošanu, un oriģinālais autors pat netiek informēts par to – saucami par "publiskiem datiem". Pirms diviem gadiem es palīdzēju mazai kvantitatīvai komandai apkopot ķēdes adreses uzvedības tagus, ņemot datus no četriem dažādiem kanāliem par to pašu adresu partiju, un rezultāts bija tāds, ka četri kanāli sniedza četras pilnīgi nesakritīgas tagu kopas. Viens teica, ka ir augstas frekvences DeFi "sūdzību risinātājs", otrs apgalvoja, ka ir parastais pārskaitījumu lietotājs, trešais bija vēl trakāks – tieši norakstījis kā "aizdomīgs raganas", ceturtais vispār nemaz nesniedza atzīmi. Es tobrīd pie ekrāna biju apjucis vairākas minūtes, vēlāk pavadīju vairākas nedēļas, manuāli pārbaudot katru rindu, un beigu beigās sapratu, ka pamatproblēma nav datu apjomā, bet gan tajā, ka šie dati no paša rašanās brīža nav saņēmuši nevienu uzticamu "dzimšanas apliecību".

Dēļ šīs lietas man ir kļuvusi obsesīva doma par "uzticamu datu avotu". Pagājušajā nedēļā es pavadīju trīs vakarus, no sākuma līdz beigām izpētot @OpenLedger oficiālo dokumentāciju un tokenu ekonomikas balto grāmatu. Atklāti sakot, pirmajā vakarā, kad lasīju ievadu, es gandrīz to aizvēru, jo AI + blokķēde ir saukļi, ko sauc jau divus gadus, un lielākā daļa projektu ir tikai izskatījuši. Bet otrajā vakarā, kad es atradu viņu atribūtu pierādījumu oficiālo dokumentāciju, bija atbloķēšanas grafiks, kas mani acumirklī pamodināja.#openleder

Lieta ir tāda. OpenLedger kopējais tokenu piedāvājums ir 1 miljards, bez papildu izsniegšanas, kas daudzos projektos ir diezgan ierobežots. Atslēga ir atbloķēšanas struktūrā; TGE laikā tikai 21.55% tiek atbrīvots tirgū, bet pārējais lēnām tiek izlaists. Komandai un investoriem ir 12 mēnešu iesaldēšanas periods, pēc tam seko 36 mēnešu lineāra atbloķēšana, katru mēnesi investori atbloķē apmēram 5.08 miljonus, komanda atbloķē apmēram 4.16 miljonus, līdz pat 48. mēnesim. To es tieši izvilku no oficiālā atbloķēšanas laika grafika.

Es Excelī izveidoju tabulu, lai aprēķinātu. Pieņemsim, ka ekosistēmas pieprasījums turpmāk nepalielinās ievērojami, tad šie mēneša pievienotie desmit miljoni apgrozībā, kad tie ienāks tirgū, prasīs cik daudz reālu lietošanas gadījumu, lai tos uzņemtu, šo skaitli jūs paši aprēķiniet. Turklāt kopienas un ekosistēmas sadale veido 61.71% no kopējā piedāvājuma, un šī daļa sāk lineāri atbloķēties kopš pirmā mēneša, kopējā summa sasniedz 381.6 miljonus. Tas nozīmē, ka pirms komandas un investoru masveida atbloķēšanas jau ir liels skaits tokenu, kas pastāvīgi tiek izlaisti datu ieguldītājiem un modeļu treniņiem. Teorētiski tas ir pozitīvs stimuls aktīviem dalībniekiem, bet reālā ietekme būs atkarīga no tā, cik daudz cilvēku patiešām strādā.

Šī informācija nav manas spekulācijas, tā viss ir oficiālo fonda dokumentu melnbaltā rakstā. Turklāt saskaņā ar oficiālo fonda lapu, OpenLedger un Chainbase ir oficiāla sadarbība, kurā Chainbase organizētie daudzķēdes strukturēti dati tiek ievadīti OpenLedger atribūtu pierādījumu sistēmā, tādējādi AI aģents lēmumu pieņemšanas laikā var zināt, no kurienes ir iegūti dati, kas tos ir ieguldījis un vai tie ir bijuši grozīti. Pašlaik redzētā informācija galvenokārt balstās uz šo sadarbību.

Vēl ir viens aspekts, kas mani vienlaikus apbrīno un mulsina. Viņu atribūtu pierādījumu sistēma izmanto metodi, ko sauc par Infini-gram, lai risinātu lielo valodu modeļu izsekošanas problēmu. Oficiālais paziņojums saka, ka tas apzīmēs katru Token ar precīzu atbilstības avotu tās treniņu datos, un tas neizskatīs tikai fiksētos n-gram logus, bet gan dinamiski meklēs garākās atbilstību sērijas, izmantojot sufiksu masīvus. Tas patiesībā ir ļoti sarežģīti. Jo lielo modeļu treniņu dati ir miljoniem miljardu Token, un tev jāatrod konkrēta izejas precīzs avots milzīgā datu apjomā reālā laikā, skaitļošanas apjoms ir astronomisks. Oficiāli teikts, ka 1.4 triljonu Token lielajā sarkano pidžamu datu kopā jebkurā n-gram meklēšanai ir nepieciešamas tikai 20 milisekundes, un uzglabāšanas izmaksas ir apmēram 7 baiti katram Token. Es nevaru patiesi pārbaudīt šo skaitli, bet vismaz tas liecina, ka viņi ir izdomājuši kaut ko par datu struktūru.

Tomēr man joprojām jāpasaka patiesība. Par verifikācijas mezglu konkrēto ļaunprātīgas izmantošanas novēršanas procesu, piemēram, kā mezgli viens otru izaicina, kā tiek sodīta stāvēšana, es pēc visu publisko dokumentu izpētes joprojām neatradu oficiālu procedūru aprakstu. Oficiāli teikts, ka mezgli ieķīlā OPEN, lai piedalītos tīkla pārvaldībā, un mezglu ienākumi ir saistīti ar tiešsaistes pieejamību, reakcijas aizkavi un verifikācijas precizitāti. Attiecībā uz datu ieguldītāju augšupielādētajiem datiem, kā tie tiek pārbaudīti, un kā tiek saukti pie atbildības ļaunprātīgi mezgli, šajā līmenī es tiešām neesmu redzējis šādas dizaina detaļas publiskajā informācijā. Tas nenozīmē, ka tas neeksistē, es varu tikai teikt, ka šobrīd tas nav publiski pieejama informācija, vai arī es vēl neesmu atradis to lapu.

Par OpenLedger galvenā tīkla palaišanas konkrēto laiku esmu redzējis divas versijas. Ir ziņojumi, kas saka, ka 2025. gada septembrī galvenais tīkls tiks uzsākts, bet The Block novembra ziņojumā teikts, ka OpenLedger oficiāli uzsāks OPEN galveno tīklu 2025. gada novembrī. Gate Blog nosauktajā padziļinātajā analīzē skaidri teikts, ka galvenais tīkls oficiāli uzsāks 2025. gada septembrī. Šāda veida informācijas nesakritība starp platformām ir pamatjautājums, ka AI datu atribūcija pamatā ir pareiza, bet izpildes līmenī ir atšķirības starp dažādiem avotiem.

Es šo saku nevis lai kritizētu, bet tāpēc, ka uzskatu, ka OpenLedger risināmais jautājums patiešām ir pelnījis uzmanību. AI treniņu datu izsekošanas problēma un ieguldītāju ieguvumu sadale ir jautājumi, kuriem ilgtermiņā ir nepieciešams nopietns risinājums. Viņi ir ieviesuši atribūtu pierādījumu zemāko slāni, pievienojot datiem verifikācijas uzlīmes uz blokķēdes un ļaujot katram modelim, kas izmanto tavus datus, automātiski izmaksāt tev naudu, kad tas veic secinājumus, šo virzienu es atbalstu. Bet tokenu izsniegšanas piedāvājuma un pieprasījuma līdzsvars, verifikācijas mezglu ļaunprātīgas izmantošanas novēršanas mehānismi, izstrādātāju ekosistēmas biezums - šie ir patiešām smagi jautājumi, ko nevienam nevajadzētu uzskatīt par viegliem. Es turpināšu sekot līdzi datu atbloķēšanai blokķēdē un PoA izsniegšanas biežumam.

Attiecībā uz OPEN konkrēto cenu, es nekad neskatos uz K līnijām. Jūs paši izlemjat.#OpenLedger $OPEN

OPEN
OPEN
0.201
+5.51%