Данные — это еда, с OpenLedger я все подсчитал

Среди моих друзей, занимающихся ИИ, немногие могут толком объяснить, откуда берутся данные для обучения их моделей. Не потому что не хотят говорить, а просто не знают. Данные в процессе передачи добавляются, удаляются, изменяются и очищаются, и их источники давно потеряли первоначальный вид. На рынке есть проекты, которые называют себя "децентрализованными данными", и все они звучат очень загадочно: данные на блокчейне, защита авторских прав, автоматическое распределение прибыли — лозунги звучат громко. Но если заглянуть в их репозитории, многие даже не запустили нормальные проверочные узлы.
На прошлой неделе я случайно наткнулся на обсуждение, где кто-то жаловался на высокие барьеры для входа в тестовую сеть OpenLedger. Технические требования довольно строгие, обычным игрокам с этим сложно справиться. Я тогда подумал, что высокая планка означает, что это не шутка. После этого я дважды внимательно перечитал их документацию на сайте, страницу с токеномикой и анонс о сотрудничестве с Chainbase. Несколько цифр заставили меня сесть и серьезно посчитать.
Сначала о тестовой сети. Официальные данные на странице: количество зарегистрированных узлов превысило 6 миллионов, не 600, а 6 миллионов. Обработано 25 миллионов транзакций, запущено 27 продуктов на основе ИИ. Эти 25 миллионов не просто «тестовые транзакции», созданные для аирдропа, это реальные данные, записанные в блокчейн, доказательство атрибуции и вызовы моделей. Этот объем в области инфраструктуры данных на блокчейне уже немаленький.
Теперь о токенах. Общий объем поставки составляет 1 миллиард штук, на TGE было выпущено 21.55% для обращения. Команда и инвесторы блокируют свои токены на 12 месяцев, затем происходит линейное разблокирование в течение 36 месяцев, каждый месяц инвесторы получают 5.08 миллиона токенов, а команда получает 4.16 миллиона токенов. Но то, на что мне действительно стоит обратить внимание, это «распределение для сообщества и экосистемы», которое составляет 61.71% от общего объема, начиная с первого дня TGE, он начинает линейно распределяться, и в общей сложности составляет 381.6 миллиона токенов. Эта часть предназначена для вознаграждения вкладчиков данных и тренеров моделей. Теоретически, если вы загружаете ценные данные в Datanet или помогаете другим проверять данные, вы можете получить $OPEN . Но проблема в том, что на данный момент официально нет открытой визуализации «рейтинга вклада Datanet» или «сколько токенов было выпущено, и сколько было реально распределено» на блокчейн-доске данных. То есть, вы знаете, что в пуле 3.8 миллиона токенов, но не знаете, сколько из них на самом деле попадает к вкладчикам каждый месяц. Эта информационная разница, я считаю, заслуживает пристального внимания.
Теперь о технологии. Их система доказательства атрибуции - это не просто простое хэширование. В официальной технической документации указано, что используется метод Infini gram с суффиксными массивами, который позволяет при выводе большого модели определенного предложения обратным образом найти наиболее близкий оригинальный фрагмент в обучающих данных. Это на самом деле сложная задача. Объем данных для тренировки больших моделей составляет триллионы токенов, и чтобы в реальном времени находить источник, требуется огромная вычислительная мощность. Официальные данные гласят, что на наборе данных красного пижамы объема 1.4 триллиона токенов любой n-граммный запрос занимает всего 20 миллисекунд, а стоимость хранения составляет примерно 7 байт на токен. Я не могу проверить эту цифру, но если это действительно можно масштабируемо и стабильно запустить, это решит корневую проблему «ИИ, использующего данные из помойки».
Но я должна сказать правду. Что касается того, как именно защитить узлы от злонамеренных действий, например, если узлы намеренно предоставляют недостаточные данные или неправильно отклоняют запросы, в официальной документации я нашла только описание о том, что необходимо ставить OPEN для участия в управлении сетью, доходы связаны с онлайн-коэффициентом и точностью валидации. Я не нашла полного набора процедурных правил «вызов - арбитраж - наказание» в открытой документации. Не то чтобы их не было, возможно, я просто не нашла, или они написаны в другом техническом белом документе, но эта часть сейчас для меня непрозрачна.
Кроме того, что касается времени запуска основной сети, я увидела два публичных заявления. Одно из глубокой статьи Gate.io, где говорится, что основная сеть официально запустится в сентябре 2025 года. Другое из отчета The Block, где сказано, что в ноябре 2025 года OpenLedger запускает основную сеть OPEN. Честно говоря, такая временная несоответствие довольно часто встречается в проектах Web3, возможно, сентябрь - это технический запуск основной сети, а ноябрь - это официальное открытие со стороны биржи и экосистемы. Я лично склоняюсь к тому, чтобы ориентироваться на официальные объявления, но на странице официальных объявлений я пока не увидела заметного заголовка с крупными буквами «Дата запуска основной сети», так что я привела оба варианта, решайте сами.
Еще одна вещь, которую я считаю важной упомянуть. 18 декабря 2025 года OpenLedger официально объявила о сотрудничестве с Chainbase, это не просто прикрепление логотипа. Chainbase интегрирует многосетевую структурированную информацию в OpenLedger, а затем каждое данные маркируется с помощью доказательства атрибуции. В официальном блоге четко написано: сеть гиперданных Chainbase преобразует оригинальные события в блокчейне в структурированные данные, которые могут быть непосредственно использованы ИИ, а доказательство атрибуции OpenLedger фиксирует каждое обращение к этим данным, каждое размышление, создавая полный проверяемый цепь. Это означает, что в дальнейшем, когда вы создаете AI-агента, данные из блокчейна, которые он использует, могут быть отслежены до оригинальных вкладчиков, и после использования они могут автоматически распределять вознаграждение среди вкладчиков. Этот замкнутый цикл, если его удастся реализовать, будет гораздо более честным, чем просто крики о «правах на данные». После выпуска объявления блокчейн-СМИ BlockchainReporter и Phemex также 19-го числа опубликовали свои отчеты, что говорит о том, что это сотрудничество вызвало немалый интерес в отрасли.
Я не хвалю этот проект, насколько он крут. 6 миллионов зарегистрированных узлов, 25 миллионов транзакций, 27 продуктов ИИ - эти цифры выглядят неплохо, но вы должны сравнить их с кем-то. По сравнению с мем-проектами, которые получают десятки тысяч адресов после выпуска токена, эти данные выглядят солидно. Но по сравнению с реальными гигантами ИИ, которым нужны объемы данных для тренировки, им не хватает нескольких порядков. Давление на выпуск токенов, прозрачность механизмов защиты узлов, визуализация фактического вклада Datanet - все это видимые краткосрочные недостатки.
Я буду постоянно следить за двумя вещами: первое - это сколько OPEN реально выпустили из экосистемного пула сообщества каждый месяц и сколько из них действительно распределили, второе - это частота вызовов и время отклика системы доказательства атрибуции в реальных сценариях. Что касается $OPEN  цены, я действительно не смотрю на свечи, решайте сами.
#OpenLedger @OpenLedger $OPEN #openleder 
OPEN
--
--