图片

Mam kumpla programistę, który złożył całkiem niezłą stację roboczą.

RTX 4090, 64 GB RAM, kupił ją za kilka miesięcznych pensji; do czego głównie jej używa?

Zwołajmy spotkanie.

Po spotkaniu trochę poodpoczywaj, po pracy wyłącz komputer, i tak to wygląda.

Maszyna, która może uruchomić DeepSeek, wdrożyć Llama i obsługiwać pół AI, ma największą codzienną misję: otrzymać trzy wiadomości na DingTalk rano, a potem przejść w stan fałszywego snu.

To nie jest moc obliczeniowa, to jest grób mocy obliczeniowej.

Ten problem jest większy, niż myślisz.

Możesz myśleć, że to tylko osobna strata, która nie ma nic wspólnego ze światem.

Ale policzyłem, że w Chinach jest około 700 milionów komputerów PC, z czego spora część ma średnie wykorzystanie nieprzekraczające 20%, a przez pozostałe 80% czasu, co one robią?

Czuwanie, blokada ekranu, tryb ochrony, po wyłączeniu ekranu, różnica między nimi a cegłą jest ograniczona do tego, że cegła nie ma wentylatora.

Z drugiej strony, firmy AI wydają duże pieniądze na GPU.

Duże firmy walczą o serwery, małe i średnie zespoły nie mogą sobie pozwolić na wynajem, wywołania API są drogie, wdrożenie prywatne jest drogie, chcesz uruchomić duży model - zapomnij, lepiej kontynuować korzystanie z API, płacąc za tokeny, ile użyjesz, tyle wydasz, a ile wydasz, nie jest do końca jasne.

Po lewej stronie jest masa nieużywanej mocy obliczeniowej, po prawej stronie masa osób potrzebujących mocy obliczeniowej, a pośrodku nic - albo raczej, KeyCompute ma stworzyć to nic pośrodku.

图片

Czym jest KeyCompute

Mówiąc prosto: platforma usług obliczeniowych AI.

Mówiąc złożenie: platforma, która pozwala ci przekształcić nieużywany komputer w węzeł obliczeniowy, a jednocześnie pozwala na wywoływanie różnych dużych modeli na żądanie.

Ale jeśli miałbym to powiedzieć najprościej, to KeyCompute robi to - wykorzystuje logikę "second-hand" w mocy obliczeniowej.

Masz w domu niewykorzystaną moc obliczeniową, inni potrzebują mocy obliczeniowej, KeyCompute buduje ten most, twoja maszyna uruchamia modele dla innych, platforma rozlicza, dostajesz pieniądze, podobnie jak wynajmowanie nieużywanego pokoju na platformie wakacyjnej, tylko że wynajmujesz CPU i GPU, a turyści to nie są goście, tylko masa tokenów.

Dla wywołującego, KeyCompute to inna sprawa: wszystkie główne modele (GPT, Claude, Gemini, DeepSeek, Llama) korzystają z jednego standardowego interfejsu API, jeden klucz, wszystko w jednym, nie trzeba rejestrować kont, zarządzać opłatami, patrzeć, który model znowu się zawiesił.

Sprawa węzłów konsumpcyjnych jest trudniejsza niż się wydaje

Możesz pomyśleć: to tylko osobisty komputer, który pomaga uruchamiać modele, brzmi to jakoś.

Nie, nie jest.

Pierwsze pytanie: twój komputer nie ma publicznego IP.

Większość domowych szerokopasmowych łączy, NAT, wewnętrzne adresy, operatorzy nie pozwalają ci na otwarcie publicznego IP, chcesz, aby czyjeś zapytanie zapukało do twoich drzwi, przepraszam, numer domu nie jest publiczny, kurier nie może dostarczyć paczki.

Podejście KeyCompute polega na wykorzystaniu "pobierania w trybie poll" do połączenia - nie czekasz, aż ktoś cię znajdzie, tylko aktywnie pytasz serwer "czy jest praca, daj mi coś", odbierasz, uruchamiasz, a po zakończeniu przesyłasz wyniki, dzięki czemu węzeł nie potrzebuje publicznego IP, ściana operatora nie ma na ciebie wpływu, zwykłe szerokopasmowe łącze wciąż działa.

Drugie pytanie: co zrobić z niestabilnością węzłów?

Twój komputer dzisiaj uruchamia model, jutro grasz w gry, pojutrze rodzina chce oglądać wideo, a za dwa dni prąd znika, węzeł może zniknąć w każdej chwili - to los sprzętu konsumpcyjnego.

Odpowiedzią KeyCompute jest automatyczne przełączanie awaryjne - jeśli jakiś węzeł znika, zadanie automatycznie wraca do kolejki, inny węzeł przejmuje, użytkownicy tego nie zauważają, system routingu cały czas przeprowadza kontrole zdrowia, tylko żywe węzły dostają zadania, te, które padły, są automatycznie wykluczane.

To nazywa się wysoką dostępnością, czyli nie pozwalaj użytkownikom wiedzieć o twoim dramatycznym zapleczu.

Jedna faktura, wszystkie modele

Osoby, które korzystały z API, mają wspólny problem: faktury są rozproszone w siedmiu lub ośmiu miejscach.

Faktura OpenAI jest w Stanach, doładowanie wymaga karty Visa, rozliczenia w dolarach, trzeba używać VPN, faktura Anthropic jest w innym miejscu, proces doładowania jest inny, DeepSeek można teraz bezpośrednio używać w kraju, ale jego faktura nie zgadza się z dwoma powyższymi.

Na koniec zarządzasz czterema lub pięcioma kontami, czterema lub pięcioma kluczami API, czterema lub pięcioma systemami rozliczeniowymi, a czas na rozliczenia co miesiąc zajmuje więcej czasu niż rzeczywisty czas wywołań.

KeyCompute zjednoczyło tę sprawę.

Wszystkie modele, jeden standardowy format API kompatybilny z OpenAI, zmiana tylko punktu końcowego, wcześniej wykorzystany kod do wywołania GPT, zmiana jednej linii URL, natychmiast można przełączyć na DeepSeek lub Gemini, doładowania przez Alipay i WeChat, rozliczenia w RMB, faktura precyzyjna do każdego wydanego tokena, nie trzeba zgadywać.

Każde wywołanie blokuje cenę w momencie wywołania, co oznacza, że dzisiaj wywołujesz, według dzisiejszej ceny, nawet jeśli jutro platforma podniesie ceny, wczorajsze zapytanie nie będzie miało retrospekcji, to powinno być podstawowe.

Czym jest ten "system dystrybucji drugiego poziomu"?

Na stronie produktu napisano "system dystrybucji drugiego poziomu".

Gdy tylko zobaczysz te cztery słowa, możesz już w głowie usłyszeć jakąś muzykę z porannych spotkań w niektórych firmach sprzedażowych.

Nie spiesz się.

Logika dystrybucji tutaj jest naprawdę prosta: polecasz KeyCompute znajomym, po rejestracji przy każdej transakcji otrzymujesz określony procent prowizji, nie jest to podciąganie pod siebie, tylko zwykła nagroda za polecenie, mechanizm zaproszenia, większość produktów SaaS to ma.

Na rynku API AI, prowizje oparte na zużyciu są całkiem rozsądne - poleciłeś przyjaciela, który co miesiąc korzysta z 1 miliona tokenów, rzeczywiście powinieneś zarobić więcej niż polecając kogoś, kto zarejestrował się, ale nigdy się nie logował.

Ale jeśli naprawdę zamierzasz na tym zarabiać głównie, to wciąż sugeruję, abyś najpierw pomyślał, dlaczego masz tylu przyjaciół chętnych do korzystania z API AI.

Kwestia stosu technologicznego

KeyCompute jest napisany w Rust.

To wybór, który sprawia, że inżynierowie mówią "wow", a nie-inżynierowie myślą "i co z tego?"

Powód, dla którego używa się Rust, zazwyczaj jest tylko jeden: wysokie wymagania wydajnościowe, brak opóźnień GC, bezpieczeństwo pamięci nie może być oparte na szczęściu, w scenariuszu bramki API AI - wysoka równoległość, niskie opóźnienie, każda transakcja jest rozliczana - rzeczywiście, Rust ma tutaj przewagę.

Backend Axum, frontend Dioxus (też framework frontendowy w Rust, z myślą podobną do React, ale napisany w Rust), baza danych PostgreSQL, pamięć podręczna Redis.

Cały stack jest stosunkowo nowoczesny, Docker Compose uruchamia go jednym kliknięciem, dla zespołów technicznych koszt przystosowania jest niski.

Dla kogo to jest

Osobisty deweloper: nie chce zarządzać wieloma kontami API, chce ujednolicić wywołania, płatności w RMB, bezpośrednie doładowania w kraju, KeyCompute jest mniej kłopotliwe niż samodzielne instalowanie VPN-u do doładowania w dolarach.

Małe i średnie przedsiębiorstwa: mają wiele linii biznesowych związanych z AI, potrzebują ujednoliconego zarządzania uprawnieniami API i zużyciem, nie chcą, aby poszczególne zespoły same zajmowały się kontami.

Osoby z wolną mocą obliczeniową: mają w domu lub w firmie wydajny, nieużywany komputer PC, instalują lekki klient, łączą się z pulą węzłów, uruchamiają, gdy jest zapotrzebowanie, a gdy nie, normalnie korzystają z maszyny, pasywne dochody, ale zyski zależą od rzeczywistego zapotrzebowania na platformie, na wczesnym etapie nie oczekuj zbyt wiele.

Partnerzy ekologiczni: mają użytkowników związanych z AI, chcą szybko uruchomić zestaw usług pośredników API, korzystając z infrastruktury KeyCompute, aby zaoszczędzić na kosztach budowy, czerpać korzyści z systemu dystrybucji.

Na koniec jedno zdanie

Kiedy to zostało po raz pierwszy poważnie omówione, wszyscy myśleli: "Jest tyle nieużywanej mocy obliczeniowej, dlaczego jej nie wykorzystać?"

A potem odkrywasz: za tymi dwoma słowami kryje się mnóstwo problemów inżynieryjnych do rozwiązania, jak połączyć się bez publicznego IP, jak zarządzać niestabilnymi węzłami, jak rozliczać koszty, jak ujednolicić wiele modeli, każdy z tych problemów można by rozwinąć w osobny artykuł techniczny.

Kierunek KeyCompute jest prawidłowy - zapotrzebowanie na moc obliczeniową AI rośnie, nieużywane zasoby obliczeniowe rosną, obie te rzeczy zachodzą jednocześnie, więc powinien istnieć platforma pośrodku.

Co do tego, czy to się uda, to jeszcze zależy od wykonania.

W końcu, projekty, które miały dobry kierunek, też często upadają, a te, które miały zły kierunek, przetrwają, to nie ma związku z mocą twojego PC, ani tym, czy twój PC codziennie się opala.

Ale przynajmniej robi coś sensownego.

Twój nieużywany komputer, może nie mieć takiego przywileju.

GitHub:

github.com/keycompute/keycompute

Kontakt:

keycompute@163.com

图片


#KeyCompute #GPT #Claude #DeepSeek #AI算力

Treści z OpenSea, które cię interesują

Przeglądaj | Twórz | Kupuj | Sprzedawaj | Licytuj

Obserwuj kanał OpenSea na Binance

Śledź najnowsze informacje