图片

Am un prieten programator care și-a strâns o stație de lucru cu specificații destul de bune.

RTX 4090, 64G RAM, când am cumpărat-o am folosit câteva luni de salariu, și în mod normal, cu ce se ocupă?

Să ne întâlnim.

După ședință, mai mă uit pe net, iar la finalul programului închid computerul, cam asta e tot.

O mașină capabilă să ruleze DeepSeek, să implementeze Llama și să susțină o parte din aplicațiile AI, are ca misiune zilnică să primească trei mesaje pe DingTalk dimineața, după care intră în modul de repaus.

Asta nu se numește putere de calcul, ci mormânt pentru puterea de calcul.

Această problemă e mai mare decât îți imaginezi.

Poate crezi că asta e doar o risipă personală, fără legătură cu lumea.

Dar am calculat că, în China, sunt aproximativ 700 de milioane de PC-uri, dintre care o parte semnificativă are o utilizare medie de maximum 20%. Ce face restul de 80% din timp?

Standby, blocare, modul de protecție, după ce ecranul se stinge, ele sunt la fel de utile ca o cărămidă, cu excepția că cărămida nu are ventilator.

Pe de altă parte, companiile AI cheltuie sume mari pe GPU-uri.

Companiile mari concurează pentru servere, echipele mici nu își permit să închirieze, apelurile API sunt scumpe, implementarea privatizată este costisitoare, vrei să rulezi un model mare - lasă, mai bine continui să ajustezi API-ul, plătești pe baza token-urilor, plătești cât folosești, dar nu poți calcula cât cheltuiești.

În stânga este o grămadă de putere de calcul nefolosită, în dreapta este o grămadă de oameni care au nevoie de putere de calcul, iar în mijloc nu este nimic - sau mai bine zis, KeyCompute trebuie să fie acel loc gol din mijloc.

图片

Ce este KeyCompute

Pe scurt: o platformă de servicii de putere de calcul AI.

Complicat spus: o platformă care îți permite să transformi un calculator neutilizat în nod de calcul, și care îți permite să accesezi diferite modele mari pe baza cererii.

Dar dacă m-ai întreba să spun în cele mai simple cuvinte, ceea ce face KeyCompute este - aplică logica de pe piața de vechituri la puterea de calcul.

Ai putere de calcul neutilizată acasă, iar alții au nevoie de putere de calcul, KeyCompute construiește acest pod, mașina ta rulează modelul altora, platforma face reconcilierea, tu câștigi bani, similar cu închirierea unei camere neutilizate pe o platformă de tip Airbnb, doar că tu închiriezi CPU și GPU, iar cei care vin nu sunt turiști, ci o grămadă de token-uri.

Pentru cei care fac apeluri, KeyCompute reprezintă un alt lucru: toate modelele mari de bază (GPT, Claude, Gemini, DeepSeek, Llama) sunt accesibile printr-un singur API standard, un singur Key care gestionează totul, fără a fi nevoie să te înregistrezi peste tot, să gestionezi costurile și să vezi care model s-a prăbușit astăzi.

Ideea de noduri de consum este mai dificilă decât te-ai gândi

Poate că te gândești: nu este vorba doar de un PC care ajută pe cineva să ruleze un model, pare destul de simplu.

Nu este așa.

Prima problemă: calculatorul tău nu are IP public.

Cea mai mare parte a lățimii de bandă la gospodării, NAT traversat, adresa de rețea internă, furnizorul de servicii nu îți permite să ai IP public, vrei să primești cereri de la alții, scuze, numărul tău nu este publicat, curierul nu poate livra.

Modul în care KeyCompute funcționează este că nodurile se conectează printr-un "polling activ" - nu așteaptă ca alții să vină la tine, ci tu întrebi serverul activ "ai muncă pentru mine?", iei și rulezi, apoi trimiți rezultatul înapoi, astfel nodurile nu necesită IP public, iar zidul furnizorului nu îți afectează, lățimea de bandă obișnuită se poate conecta.

A doua problemă: ce facem dacă nodul nu este stabil.

Astăzi, calculatorul tău rulează un model, mâine te joci, poimâine, familia vrea să vizioneze un video, iar în următoarea zi se oprește curentul. Nodurile pot dispărea oricând, aceasta este soarta echipamentelor de consum.

Răspunsul KeyCompute este transferul automat de sarcini - dacă un nod dispare, sarcina este reîncărcată automat, un alt nod preia, utilizatorul nu percepe acest lucru, sistemul de rutare face în mod constant verificări de sănătate, doar nodurile active primesc sarcini, cele care au picat sunt excluse automat.

Asta se numește disponibilitate ridicată, de asemenea, nu lăsa utilizatorul să știe despre dramele din spatele scenei.

O factură, toate modelele

Cei care au apelat la API au o problemă comună: facturile sunt dispersate în șapte sau opt locuri.

Facturile OpenAI sunt în SUA, reîncărcările necesită un card Visa, plăți în dolari, trebuie să folosești un VPN, facturile Anthropic sunt în alt loc, procesul de reîncărcare este diferit, DeepSeek poate fi folosit direct în țară acum, dar facturile sale nu se potrivesc cu celelalte două.

În cele din urmă, menții patru sau cinci conturi, patru sau cinci chei API, patru sau cinci sisteme de facturare, timpul pentru reconcilierea lunară este mai lung decât timpul efectiv de apel.

KeyCompute a unificat această chestiune.

Toate modelele, un format API standard compatibil OpenAI, schimbi doar endpoint-ul și asta e tot, codul care apela GPT devine compatibil cu DeepSeek sau Gemini doar schimbând un URL, reîncărcare în Alipay sau WeChat, plăți în RMB, facturile sunt precise pe fiecare cerere, nu trebuie să ghicești.

Fiecare apel blochează o instantanee a prețului la momentul apelului, adică, dacă faci un apel astăzi, se calculează la prețul de astăzi, chiar dacă mâine platforma își crește prețul, cererea de ieri nu va fi retroactivă. Asta ar trebui să fie o decență de bază.

Ce este acel "sistem de distribuție secundar"?

Pe pagina produsului scrie "sistem de distribuție secundar".

Când vezi aceste patru cuvinte, s-ar putea să îți vină în minte muzica de fond dintr-o întâlnire de dimineață a unor companii de vânzări directe.

Nu te grăbi.

Logica de distribuție de aici este foarte simplă: promovezi KeyCompute prietenilor, prietenii se înregistrează și de fiecare dată când consumă, primești un anumit procent din comision, nu este vorba de a trage pe cineva în jos, ci pur și simplu o recompensă de recomandare, cu un mecanism de cod de invitație, majoritatea produselor SaaS au asta.

Pe acest segment de API-uri AI, recomandările bazate pe utilizare sunt de fapt destul de rezonabile - ai recomandat un prieten care face apeluri de 1 milion de token-uri pe lună, ar trebui să primești mai mult decât dacă ai recomandat pe cineva care s-a înregistrat dar nu a mai intrat niciodată.

Dar dacă chiar intenționezi să te bazezi pe asta ca pe o activitate principală, îți sugerez să te gândești de ce ai atât de mulți prieteni care vor să folosească API-uri AI.

Aspectul stivei tehnologice

KeyCompute este scris în Rust.

Aceasta este o alegere care îi face pe ingineri să exclame "wow", și pe non-ingineri să se gândească "și ce dacă".

Motivul pentru care se folosește Rust este de obicei unul singur: cerințe de performanță ridicate, fără opriri GC, siguranța memoriei nu se bazează pe noroc, în cazul unui gateway API AI - concurență ridicată, latență scăzută, fiecare cerere este facturată - este un domeniu în care Rust are un avantaj.

Backend Axum, frontend Dioxus (de asemenea un framework frontend bazat pe Rust, similar cu React, dar scris în Rust), baza de date PostgreSQL, cache Redis.

Întreaga stivă este relativ modernă, Docker Compose se poate ridica cu o singură comandă, costul de învățare pentru echipele tehnice nu este ridicat.

Cine ar trebui să folosească

Dezvoltatori individuali: nu vor să gestioneze mai multe conturi API, vor un apel unificat, plăți în RMB, reîncărcare directă în țară, KeyCompute este mai puțin complicat decât să îți creezi un VPN și să plătești în dolari.

Mici și mijlocii întreprinderi: au mai multe linii de afaceri legate de AI, trebuie să gestioneze unitar permisiunile cheilor API și utilizarea, nu doresc ca fiecare echipă să își creeze conturi proprii.

Cei care au putere de calcul nefolosită: dacă ai un PC de performanță bună acasă sau la birou, instalează un client ușor, conectează-te la pool-ul de noduri, rulezi când ai apel, folosești normal mașina când nu ai apel, venit pasiv, dar câștigurile depind de volumul real de apeluri al platformei, așa că nu îți face așteptări prea mari în stadiile incipiente.

Parteneri ecologici: au o comunitate de utilizatori AI, doresc să lanseze rapid un serviciu de intermediere API, să folosească infrastructura KeyCompute pentru a economisi costurile de construire proprie, și să beneficieze de sistemul de distribuție.

În final, un ultim cuvânt

Când s-a discutat serios pentru prima dată despre acest subiect, gândul tuturor a fost: "Atâta putere de calcul nefolosită, de ce să nu o folosim?"

Apoi am realizat: folosirea acestor două cuvinte vine cu o mulțime de probleme de inginerie de rezolvat, cum să te conectezi fără IP public, cum să gestionezi nodurile instabile, cum să faci reconcilierea facturii, cum să unifici modelele - fiecare problemă merită un articol tehnic separat.

Direcția KeyCompute este corectă - cererea de putere de calcul AI este în creștere, resursele de calcul neutilizate sunt în creștere, ambele lucruri se întâmplă simultan, și ar trebui să existe o platformă în mijloc.

Dacă se va putea face, depinde de execuție.

Cu toate acestea, proiectele care au direcția corectă au murit, iar cele care au direcția greșită au supraviețuit, asta nu are legătură cu puterea de calcul a PC-ului tău, și nu are legătură nici cu cât de mult își expune PC-ul soarele în fiecare zi.

Dar măcar, face o treabă semnificativă.

Calculatorul tău neutilizat poate să nu aibă un astfel de privilegiu.

GitHub:

github.com/keycompute/keycompute

Informații de contact:

keycompute@163.com

图片


#KeyCompute #GPT #Claude #DeepSeek #AI算力

Conținutul OpenSea care te interesează

Vizualizează | Creează | Cumpără | Vinde | Licitație

Salvează și urmărește canalul OpenSea Binance

Stai la curent cu cele mai recente informații