O que são Datanets? Como os Datanets são o motor por trás da Inteligência Artificial da OpenLedger

A maioria das pessoas fala sobre Inteligência Artificial como se os modelos fossem a história. Eles comparam chatbots, discutem sobre qual empresa está à frente ou se obsessem sobre quem tem o sistema mais poderoso. Depois de passar um tempo em projetos como OpenLedger, comecei a perceber algo importante. A verdadeira história não é o modelo em si. É os dados por trás da Inteligência Artificial.
A Inteligência Artificial só se torna útil porque os humanos alimentam silenciosamente com conhecimento todos os dias. Estamos falando de artigos, pesquisas, tutoriais, anotações médicas, análises financeiras, documentação técnica. Esses são anos de experiência registrados online. Os modelos parecem inteligentes porque são treinados com informações criadas por pessoas que já entendiam o mundo antes da Inteligência Artificial existir.
É aí que os Datanets entram. No começo, pensei que o termo soasse excessivamente técnico. Mas quanto mais eu olhava para isso, mais prático a ideia se tornava. Um Datanet é basicamente uma rede de conhecimento construída em torno de um assunto ou indústria específicos. Em vez de despejar um conteúdo aleatório interminável da internet em um sistema de Inteligência Artificial, a ideia é organizar informações em torno de expertise que realmente importa.
Honestamente, isso parece atrasado. Agora, a maioria dos sistemas de Inteligência Artificial é treinada em enormes quantidades de dados públicos da internet. A filosofia tem sido basicamente simples: coletar o máximo de informações possível e deixar o modelo descobrir as coisas por conta própria. Essa abordagem ajudou a criar sistemas capazes, mas também criou uma bagunça. A internet está cheia de informações duplicadas, opiniões desatualizadas, desinformação, spam e conteúdo escrito por pessoas que não sabem realmente do que estão falando.
Para conversas que podem não importar muito... Uma vez que a Inteligência Artificial comece a entrar em indústrias sérias como saúde, direito, finanças, cibersegurança ou pesquisa científica, dados de baixa qualidade se tornam um problema real. Uma Inteligência Artificial médica treinada em discussões da internet não é algo que você deseja tomando decisões importantes.
Os Datanets tentam abordar as coisas de forma diferente. Em vez de tratar todas as informações de maneira igual, eles se concentram no conhecimento especializado de pessoas que realmente entendem um campo. Um Datanet pode girar em torno da análise de documentos e contratos. Outro pode se focar inteiramente em agricultura, pesquisa climática, engenharia de software ou reclamações de seguro. As informações dentro desses sistemas devem ser mais estruturadas, mais contextuais e, esperançosamente, mais confiáveis.
A parte que realmente chamou minha atenção não foi a organização. Foi a propriedade. A maioria das pessoas não pensa sobre o que acontece com seus dados depois de postar algo online. Um desenvolvedor faz upload de código de código aberto. Um pesquisador publica anos de trabalho. Alguém escreve um tutorial explicando um tópico complexo melhor do que qualquer outro. Eventualmente, pedaços dessa informação são absorvidos nos sistemas de treinamento de Inteligência Artificial. O criador original geralmente desaparece completamente da equação.
A Inteligência Artificial melhora. A empresa lucra. O contribuinte não recebe nada. Essa dinâmica se tornou silenciosamente normal. O OpenLedger parece estar desafiando essa suposição ao construir a atribuição dentro do sistema. Os Datanets não são apenas depósitos de armazenamento de informações. Eles são projetados para rastrear de onde vem o conhecimento e como ele contribui para as saídas da Inteligência Artificial. Se seus dados ajudam a melhorar um modelo que as pessoas realmente usam, o sistema tenta reconhecer essa contribuição e recompensá-la.
Isso muda completamente a conversa. No momento em que o conhecimento começa a se comportar menos como conteúdo descartável da internet e mais como um ativo conectado à pessoa que o criou. É uma mudança, mas parece importante. A internet treinou as pessoas para aceitar que, uma vez que algo é postado online, basicamente pertence para sempre às plataformas e algoritmos. Os Datanets introduzem a ideia de que os contribuintes podem ainda assim importar após o botão de upload ser pressionado.
Claro que nada disso é simples. Rastrear a influência dentro de sistemas de Inteligência Artificial é incrivelmente difícil. Modelos de aprendizado de máquina não armazenam informações de forma organizada como um catálogo de biblioteca. O conhecimento se espalha por bilhões de relações dentro do modelo. Tentar identificar qual conjunto de dados exato influenciou uma resposta específica é bagunçado e complicado. Às vezes, isso provavelmente beira o impossível.
Isso é parte do motivo pelo qual a maioria das empresas evita falar sobre atribuição. É mais fácil tratar os dados de treinamento como matéria-prima do que construir sistemas que reconheçam de onde a inteligência realmente veio... O Openledger parece disposto a experimentar esse desafio de qualquer maneira... Honestamente, até mesmo tentar isso parece diferente da direção que a maior parte da indústria de Inteligência Artificial tomou até agora.
A grande questão é se sistemas como esse podem escalar além de adotantes e comunidades de nicho. Agora a ideia parece atraente porque as pessoas estão cada vez mais desconfortáveis com a forma como as empresas de Inteligência Artificial coletam e monetizam informações. Há uma crescente conscientização de que enormes sistemas de Inteligência Artificial foram treinados com anos de criatividade, expertise e trabalho sem permissão ou compensação claras. Os Datanets aproveitam essa frustração propondo uma alternativa mais transparente.
A transparência também cria atrito. Algumas indústrias dependem de confidencialidade. Outras confiam em informações. Muitas empresas podem não querer visibilidade sobre como seus sistemas de treinamento funcionam ou de onde seus dados se originaram... Uma vez que incentivos financeiros se tornam vinculados a contribuições, sempre há o risco de as pessoas inundarem os sistemas com conteúdo de baixa qualidade apenas para perseguir recompensas.
Isso significa que moderação, verificação e controle de qualidade se tornam extremamente importantes. Um Datanet cheio de informações não é valioso, não importa quão sofisticada a infraestrutura pareça por baixo. Ainda assim, acho que a ideia por trás dos Datanets importa mais do que as pessoas percebem agora. A indústria de Inteligência Artificial passou anos obcecada por modelos, hardware mais rápido e conjuntos de dados maiores... Eventualmente, a conversa sempre iria voltar à fonte da inteligência em si. A qualidade dos dados importa. A expertise importa. O contexto importa. O conhecimento humano ainda está por trás de tudo.
Os Datanets parecem uma tentativa de reconstruir sistemas de Inteligência Artificial em torno dessa realidade de fingir que a inteligência aparece magicamente apenas pela escala. Talvez o modelo funcione a longo prazo. Talvez ele lute sob pressão do mundo real. Ninguém realmente sabe ainda... Depois de passar um tempo entendendo como os Datanets funcionam dentro do ecossistema OpenLedgers, parei de vê-los apenas como mais um recurso de blockchain com um nome futurista.
Eles parecem uma argumentação silenciosa sobre quem deve se beneficiar da próxima geração de Inteligência Artificial... Honestamente, essa pergunta provavelmente é mais importante do que a tecnologia em si. Os Datanets e a Inteligência Artificial estão conectados de uma forma que faz você pensar sobre o futuro. Os Datanets são parte do sistema de Inteligência Artificial do OpenLedger... O Openledger está tentando mudar a maneira como pensamos sobre Inteligência Artificial e Datanets.
@OpenLedger #OpenLedger $OPEN