Szczerze mówiąc, na początku obserwując ranking Datanet, miałem bardzo prosty cel. Chciałem znaleźć najbardziej zyskowny tor danych. Ponieważ według mojej wiedzy, wyższa pozycja w rankingu oznacza, że liczba wywołań jest wysoka; wysoka liczba wywołań oznacza wysokie zyski. Logika wydaje się całkiem rozsądna.
Zatem w zeszłym tygodniu postanowiłem sobie zadanie. Przez 7 dni. Codziennie o stałej porze zapisywałem zmiany w rankingach Datanet, obserwując, które zestawy danych rosną. Które zestawy danych spadają. Na początku przez dwa dni skupiłem się tylko na rankingu. Kto rośnie najszybciej. Kto spada najszybciej. Kto ma wysoką liczbę wywołań. Nawet specjalnie zrobiłem tabelę. W rezultacie trzeciego dnia nagle zauważyłem dziwne zjawisko. Kilka zestawów danych nie miało wysokiej pozycji w rankingu. Nawet długo utrzymywały się w średniej stawce. Ale prawie nie wykazywały dużych wahań. Codziennie były stabilnie obecne.

Wręcz przeciwnie, niektóre zestawy danych, które były na czołowej pozycji, często spadały co kilka dni. Wtedy myślałem, że to przypadek. Po dłuższym obserwowaniu, sytuacja stawała się coraz bardziej oczywista. Potem zacząłem patrzeć z innej perspektywy. Nie tylko na ranking, ale na 'czas przeżycia'. Wynikiem tego było odkrycie, które zapadło mi w pamięć. Wiele popularnych zestawów danych przypomina gorące wiadomości. Szybko wybuchają. Szybko też zanikają. A te, które są naprawdę stabilnie wykorzystywane przez długi czas, przypominają infrastrukturę. Zazwyczaj nikt o nich nie mówi, ale zawsze są wykorzystywane. To właśnie wtedy na nowo zrozumiałem jedno pytanie. Wiele osób rozmawiając o danych AI, zawsze lubi pytać: które dane są najcenniejsze? Ale na prawdziwym rynku, być może ważniejsze pytanie brzmi: które dane są najbardziej niezastąpione? Ponieważ ilość wywołań można uzyskać dzięki trendom, ale długoterminowe wywołania mogą polegać tylko na popycie.
Potem znowu spojrzałem na projekt Datanet @OpenLedger . Nagle zauważyłem, że różni się on znacznie od tradycyjnego rynku danych. Wartość danych tutaj nie polega na jednorazowej transakcji. Ale na ciągłej weryfikacji. Ciągłym wykorzystaniu. Ciągłym rozliczaniu. To oznacza, że długoterminowy asset, który dążą do osiągnięcia dostawcy danych, niekoniecznie jest skokowy. Wręcz przeciwnie, bardziej przypomina zarządzanie długoterminowym aktywem. Ta zmiana postrzegania jest naprawdę duża. Bo wcześniej zawsze myślałem, że rynek danych AI opiera się na skali.
Teraz coraz bardziej uważam, że chodzi o trwałość. Wiele danych może być bardzo cennych w pierwszym dniu. Ale po trzech miesiącach nikt ich nie potrzebuje. A niektóre dane, które wydają się niepopularne, mogą być wykorzystywane przez długi czas. Ostateczna wartość obu jest zupełnie różna. Oczywiście, jest jeszcze jedna kwestia, której nie zrozumiałem.
Jeśli w przyszłości wszyscy zaczną gonić za danymi, które są długoterminowo stabilne, czy nie pojawią się nowe tłumy? Czy na końcu nie powstanie nowy monopol na czołowej pozycji? To wciąż obserwuję.
Ale przynajmniej te 7 dni uświadomiło mi, że najważniejsze w rankingu Datanet nie jest to, kto jest na pierwszym miejscu. Ale kto nie spada w dół. Te dwie rzeczy wyglądają podobnie, ale w rzeczywistości to zupełnie inna logika.
