Atualmente, os modelos de IA estão sendo treinados com que tipo de dados, a galera do mercado já sabe. É aquele tipo de 'dados públicos' que a gente encontra na internet, sem saber se pode usar comercialmente, e o autor nem recebe um toque. Há dois anos, ajudei uma pequena equipe de quant a coletar etiquetas de comportamento de endereços on-chain, utilizando quatro fontes diferentes para a mesma leva de endereços, e o resultado? Quatro fontes deram quatro conjuntos de etiquetas completamente desencontradas. Um disse que era um trader de alta frequência de DeFi, outro falou que era um usuário de transferências normais, o terceiro foi mais longe e rotulou como 'suspeito de bruxa', e o quarto simplesmente não marcou nada. Fiquei parado na frente da tela por vários minutos, depois passei semanas conferindo tudo manualmente, e no fim percebi que o problema não era a quantidade de dados, mas sim que, desde o momento em que esses dados foram gerados, nenhum tinha um 'certificado de nascimento' confiável.

Por causa disso, desenvolvi uma obsessão com as palavras "fontes de dados confiáveis". Na semana passada, passei três noites fazendo uma análise minuciosa da documentação oficial e do whitepaper de tokenômica de @OpenLedger . Para ser honesto, na primeira noite, quase desliguei quando li a introdução; a combinação de IA + blockchain foi um slogan que ouvimos por dois anos, e a maioria dos projetos é só isso. Mas na segunda noite, quando encontrei o documento oficial sobre a prova de atribuição, uma tabela de cronograma de liberação me fez acordar instantaneamente. #openleder

A situação é a seguinte. O fornecimento total de tokens da OpenLedger é de 1 bilhão, sem emissões adicionais, o que é considerado bastante moderado em muitos projetos. O ponto chave está na estrutura de liberação, onde no TGE apenas 21,55% foi liberado para circulação, e o restante será liberado lentamente. A equipe e os investidores têm um período de lock-up de 12 meses, após o qual haverá uma liberação linear ao longo de 36 meses, com aproximadamente 5,08 milhões de tokens sendo liberados por mês para investidores e cerca de 4,16 milhões para a equipe, continuando até o 48º mês. Isso é uma citação direta do cronograma de liberação oficial.

Eu fiz uma tabela no Excel e fiz as contas. Supondo que a demanda do ecossistema não cresça significativamente, essa nova circulação mensal de quase 10 milhões de tokens que entra no mercado, quantos cenários de uso reais serão necessários para suportar isso, vocês mesmos podem calcular. Além disso, a alocação para a comunidade e ecossistema representa 61,71% do fornecimento total, e essa parte já começa a ser liberada linearmente desde o primeiro mês, totalizando impressionantes 381,6 milhões de tokens. Isso significa que antes de uma grande liberação dos tokens da equipe e dos investidores, já há uma grande quantidade de tokens sendo liberada continuamente para os contribuidores de dados e treinadores de modelos. Teoricamente, isso é um incentivo positivo para os participantes ativos, mas a eficácia real dependerá de quantas pessoas estão realmente trabalhando.

Essas informações não são apenas palpites meus, estão todas escritas em preto e branco nos documentos oficiais da fundação. Além disso, de acordo com a página oficial da fundação, a OpenLedger e a Chainbase têm uma colaboração oficial, onde os dados estruturados multi-chain organizados pela Chainbase são alimentados no sistema de prova de atribuição da OpenLedger, assim, o Agente de IA, ao tomar decisões, saberá de onde vêm os dados, quem os contribuiu e se foram alterados. As informações que vi até agora se concentram principalmente nessa colaboração.

Tem um ponto que me deixa tanto admirado quanto preocupado. O sistema de prova de atribuição deles usa um método chamado Infini-gram para lidar com a questão da rastreabilidade dos grandes modelos de linguagem. O que eles dizem é que cada Token terá sua origem exata nos dados de treinamento marcada, e não apenas olhando para janelas fixas de n-gramas, mas usando arrays de sufixos para encontrar dinamicamente a sequência de correspondência mais longa. Isso é, na verdade, muito complicado. Porque os dados de treinamento de grandes modelos facilmente ultrapassam trilhões de Tokens, e você precisa encontrar em tempo real a origem exata de uma saída em meio a uma quantidade massiva de dados, o cálculo é astronômico. O oficial diz que, em um dataset de 1,4 trilhões de Tokens, pesquisar qualquer n-grama leva apenas 20 milissegundos, com um custo de armazenamento de cerca de 7 bytes por Token. Não consigo verificar esse número na prática, mas pelo menos mostra que eles estão pensando em algumas soluções na estrutura de dados.

No entanto, preciso ser honesto. Quanto aos processos específicos de prevenção de comportamento malicioso dos nós de validação, como os nós se desafiam e como a penalização dos tokens depositados acontece em caso de desafio bem-sucedido, após revisar todos os documentos públicos, ainda não encontrei uma descrição processual oficial. O que eles dizem é que os nós devem depositar OPEN para participar da governança da rede, e a renda dos nós está ligada à taxa de online, latência de resposta e precisão de validação. Quanto à validação específica dos dados que os contribuidores enviam e como responsabilizar os nós por comportamentos maliciosos, não vi detalhes de design nesse nível nas informações públicas. Não estou dizendo que não existe, apenas que atualmente não é informação pública, ou talvez eu ainda não tenha encontrado aquela página.

Sobre a data específica de lançamento da mainnet da OpenLedger, vi duas afirmações. Um grupo de reportagens diz que a mainnet será lançada em setembro de 2025, mas uma reportagem da The Block em novembro afirmou que a OpenLedger lançará oficialmente a mainnet OPEN em novembro de 2025. A análise aprofundada da Gate Blog, com o mesmo nome, afirma claramente que a mainnet será oficialmente lançada em setembro de 2025. Essas inconsistências de informação entre plataformas são um problema central; a direção subjacente da atribuição de dados de IA está correta, mas em que nível de execução realmente se encontra, as descrições de diferentes fontes variam.

Não estou dizendo isso para ser crítico, mas realmente acho que a questão que a OpenLedger está tentando resolver merece atenção. A questão da rastreabilidade dos dados de treinamento da IA e a distribuição de benefícios para os contribuidores precisam, a longo prazo, de um plano sério para lidar com isso. Eles incorporaram a prova de atribuição na infraestrutura básica, dando aos dados um rótulo de crédito verificável na blockchain, e permitindo que cada modelo que usa seus dados te pague automaticamente durante a inferência. Eu apoio essa direção. Mas o equilíbrio de oferta e demanda na liberação de tokens, os mecanismos de prevenção de comportamento malicioso nos nós de validação, e a robustez do ecossistema dos desenvolvedores são questões que realmente precisam ser enfrentadas, ninguém pode simplesmente ignorá-las. Vou continuar de olho na liberação de dados na blockchain e na frequência de chamadas PoA.

Quanto ao valor exato do OPEN, eu nunca olho para o gráfico de velas. Vocês que decidem. #OpenLedger $OPEN

OPEN
OPEN
0.1905
+3.81%