openledger piešķiršanas precizitāte pasliktinās, kad modeļi uzlabojas

@OpenLedger 
Pirms dažām dienām es izlasīju piešķiršanas pierādījuma baltās grāmatas dokumentu, gaidot augsta līmeņa tehnisko ietvaru, kādu izmanto vairums AI blokķēdes projektu, lai aprakstītu mehānismus, kurus viņi vēl nav pilnībā īstenojuši. Tas ir standarts. Publiskot baltās grāmatas dokumentu, kas norāda uz metodoloģiju, nosūtīt produktu, kas to aptuveni atbilst, un cerēt, ka neviens neseko atšķirībai starp abiem. Openledger baltā grāmata tāda nav. Tā apraksta divus konkrētus piešķiršanas pieejas ar patiesu tehnisko dziļumu: ietekmes funkciju tuvinājumus mazākiem modeļiem un suffix-masīva bāzētu token piešķiršanu lielākiem. Metodoloģija ir reāla. Kāds par to rūpīgi domāja.
tad es izlasīju suffix-array pieeju uzmanīgāk.
suffix-array atribūcija darbojas, saspiežot apmācību korpusu un pārbaudot, vai izejas simbolu secības parādās iegaumētās daļās no šī korpusa. ideja ir tāda, ka, ja modeļa izeja satur simbolu secības, kas sakrīt ar saspiestajiem apmācību datiem, varat atgriezt šo ietekmi pie konkrētiem dalībniekiem. tā ir likumīga tehnika. bet tai ir specifiska mērogošanas īpašība, ko baltā grāmata atzīst tādā veidā, ko lielākā daļa lasītāju varētu apiet, neapstājoties: pieeja identificē iegaumētās daļas, nevis ietekmēto racionālo domāšanu. modelis, kas patiesi ir mācījies no nozares ekspertīzes, ražos izejas, kas atspoguļo šo ekspertīzi bez nepieciešamības reproduktēt iegaumētās simbolu secības. atribūcijas mehānisms atlīdzina iegaumēšanas atklājamo ietekmi. tas var sistemātiski nepietiekami saskaitīt datu ieguldījumu, kas iemācīja modelim domāt, nevis datus, ko modelis iemācījās reproducēt. 🔍
šī atšķirība ir ārkārtīgi svarīga tam, ko openledger cenšas izveidot. visa vērtības piedāvājums specializētiem valodas modeļiem - iemesls, kāpēc dataneti pastāv, iemesls, kāpēc dalībnieki būtu jādod nozares saistīti dati, nevis nokasīti teksti, ir tas, ka patiesa nozares ekspertīze rada labāku racionālu domāšanu, nevis tikai labāku memorēšanu. juridisks modelis, kas apmācīts, balstoties uz rūpīgi strukturētu līgumu analīzi, būtu jāražo izejas, kas atspoguļo juridisko domāšanu, nevis izejas, kas reprodukcē juridisko valodu vārds vārdā. Bet suffix-array atribūcija mēra otro ietekmes veidu uzticamāk nekā pirmo. kā modeļi aug un to izejas kļūst mazāk reproducēti līdzīgi apmācību datiem un vairāk patiesi transformēti, atribūcijas mehānisms var kļūt pakāpeniski mazāk precīzs tieši tad, kad modeļi kļūst visizsmalcinātākie un visvērtīgākie.
esmu sēdējusi ar konkrētu implikāciju, ko nevaru pilnībā atrisināt. dalībnieki, kuri sniedz visvērtīgākos datus - nozares eksperti, kuri piedāvā strukturētu analīzi un rūpīgi pārdomātus piemērus, nevis tikai neapstrādātu tekstu, var tikt sistemātiski nepietiekami novērtēti salīdzinājumā ar dalībniekiem, kuri sniedz lielu apjomu teksta datu ar ievērojamiem simbolu secībām. Abi dalībnieku profili redzēs atribūcijas notikumus. Bet eksperta dalībnieka ietekme, kas darbojas caur racionālu transformāciju, nevis simbolu reproducēšanu, radīs vājākus atribūcijas signālus zem suffix-array saskaņošanas. Atlīdzības struktūra, šķiet, darbojas. Atlīdzību sadalījums šajā struktūrā varētu neatbilst faktiskās vērtības sadalījumam, kas tika sniegta.
es vēroju kaut ko strukturāli līdzīgu, kas notika ar meklētājprogrammu rangēšanas algoritmiem 2010. gadu sākumā. algoritmi mērīja to, ko varēja izmērīt: saites blīvumu, atslēgvārdu biežumu, teksta atkārtošanos, jo šie signāli bija tehniski apstrādājami. to, ko tie nevarēja mērīt tieši, bija tas, ko viņi patiešām vēlējās izmērīt: patiesa ekspertīze un autoritatīvas zināšanas. rezultāts bija tas, ka saturs, kas tika optimizēts mērāmām zīmēm, pārspēja saturu ar patiesu ekspertīzi, līdz algoritmi kļuva pietiekami sarežģīti, lai aizvērtu to atstarpi. optimizācija notika nevis tāpēc, ka satura veidotāji bija ļaunprātīgi, bet gan tāpēc, ka mērījums bija sistemātiski novirzīts no pamatvērtības. openledger atribūcijas mehānisms var būt tieši tajā pašā agrīnā algoritmu posmā, mērījot apstrādājamu aizstājēju ietekmei, nevis pašu ietekmi, un atlīdzina aizstājēju, nevis vērtību.
patiesi spēcīgais elements šeit ir tas, ka baltais dokuments atzīst metodoloģijas ierobežojumus, nevis tos slēpj. šī caurspīdība ir vairāk nekā lielākā daļa AI blockchain projektu piedāvā, un tā norāda, ka komanda saprot, ka mērījums ir tuvredzīga pieeja. atribūcijas dzinēja atjauninājums no 2026. gada janvāra tika īpaši izstrādāts, lai saglabātu datu izejas saites, kamēr modeļi attīstās, kas liecina, ka komanda identificēja mērogošanas problēmu kā kaut ko, kas prasa aktīvu inženieru uzmanību, nevis teorētisku jautājumu, ko var norakstīt un aizmirst.
ir versija par šo, kur es esmu kļūdījusies. openledger varēja ieviest hibrīda atribūcijas pieeju ražošanā, kas papildina suffix-array saskaņošanu ar ietekmes funkciju svēršanu lielākiem modeļiem, izmantojot dārgāku, bet precīzāku metodi tieši tur, kur lētā metode kļūst neuzticama. ja šis hibrīds pastāv un darbojas, atribūcijas precizitāte nepazeminās mērogā, un ekspertu dalībnieki tiek pienācīgi novērtēti. ko es nevarēju atrast publiskajā dokumentācijā, bija jebkāda apstiprinājuma, ka ražošanas sistēma izmanto citu pieeju nekā baltajā grāmatā aprakstītā primārā pieeja lieliem modeļiem.
ko es vēlētos redzēt, nav tehnisks atjauninājums uz baltā dokumenta. faktiska publiska atribūcijas metodoloģijas izklāsts pēc modeļa izmēra, īpaši, kura atribūcijas pieeja darbojas uz kuriem modeļiem, kas pašlaik izvietoti galvenajā tīklā, un vai kāda hibrīda vai papildus pieeja darbojas modeļiem virs konkrēta parametra sliekšņa. šis atklājums, kas parādās jebkurā dokumentācijas atjauninājumā kopš atribūcijas dzinēja atjauninājuma, kas tika izlaists janvārī, man pateiks, vai mērogošanas ierobežojums ir zināma tuvredzīga pieeja, ko komanda aktīvi risina, vai neatzīta plaisa starp to, ko baltais dokuments apraksta, un to, ko ražošanas sistēma pašlaik mēra. tās neesamība nozīmē, ka openledger visprecīzākie dalībnieki - tie, kuru ekspertīze transformē modeļa racionālu domāšanu, nevis modeļa vārdu krājumu - varētu būt tie, kurus sistēma vismazāk spēj novērtēt. kas ir dīvaina vieta protokolam, kura visa vērtības piedāvājums ir tas, ka tas padara ieguldījumu ietekmi pārbaudāmu, nevis pieņemamu.
#OpenLedger $OPEN 
OPEN
0.1907
+3.92%