Недавно я наткнулся на новость, которая меня просто поразила

Недавно я наткнулся на новость, которая меня просто поразила. На Hugging Face кто-то создал поддельный злонамеренный репозиторий, имитирующий OpenAI, который с помощью автоматического скрипта накрутил фальшивые звезды и взлетел на первое место в трендах, был скачан 240000 раз. Внутри была зашита шпионская троянская программа, которая выуживала пароли, кошельки и даже токены Discord прямо из браузера. Уровень этой атаки превосходит все ожидания: подумайте, сколько разработчиков просто вводят название модели и устанавливают её через pip, и вот они уже в ловушке.
Это заставило меня задуматься о важном вопросе — наши данные для обучения ИИ все еще чисты? Какой смысл в огромной модели и быстрой инференции, если данные, которые мы используем, уже "отравлены"? Можете ли вы доверять каждому слову, которое говорит ИИ? Именно поэтому я постоянно слежу за @OpenLedger , потому что то, что они делают, идеально вписывается в эту критическую точку.
Много проектов сосредоточено на скорости инференции и параметрах моделей, но OpenLedger делает акцент на "чистоте данных". Их рынок данных Datanets фиксирует источник каждой строки данных, аннотаторов и записи использования на блокчейне. Как только агент использует эти данные для инференции, можно отследить, чью идею он использовал и какие знания передал.
Более того, есть экономическая составляющая. Токены $OPEN автоматически распределяют прибыль при каждом использовании данных агентом, так что вкладчики не работают даром. Данные становятся активом, которое можно потреблять и проверять, а не топливом, которое используют гиганты.
Я считаю, что эта ниша будет становиться все более ценной.
#openledger $OPEN