
Có một người bạn lập trình viên, đã ráp một chiếc workstation cấu hình khá tốt.
RTX 4090, 64G RAM, khi mua đã tiêu tốn vài tháng lương, bình thường dùng để làm gì?
Họp.
Họp xong làm chút việc vặt, tan sở tắt máy, cứ vậy đi.
Một máy có thể chạy DeepSeek, triển khai Llama, nâng đỡ một nửa ứng dụng AI, sứ mệnh hàng ngày lớn nhất của nó, là nhận ba tin nhắn trên DingTalk vào buổi sáng, sau đó vào trạng thái ngủ giả.
Đây không gọi là sức mạnh tính toán, mà gọi là ngôi mộ sức mạnh tính toán.
Vấn đề này lớn hơn bạn nghĩ
Bạn có thể nghĩ rằng, đây chỉ là sự lãng phí cá nhân, không liên quan gì đến thế giới.
Nhưng tính toán một chút, Trung Quốc có khoảng 7 triệu PC, trong đó một phần lớn có mức sử dụng trung bình không quá 20%, còn lại 80% thời gian, chúng đang làm gì?
Chế độ chờ, khóa màn hình, chế độ bảo vệ, sau khi màn hình tắt, chúng chỉ khác một viên gạch ở chỗ là viên gạch không có quạt.
Mặt khác, các công ty AI đang chi tiền lớn để mua GPU.
Các công ty lớn tranh giành máy chủ, các đội ngũ nhỏ không thuê nổi, gọi API thì đắt, triển khai riêng tư thì đắt, muốn tự chạy một mô hình lớn - thôi, vẫn tiếp tục điều chỉnh API đi, tính phí theo Token, dùng bao nhiêu trả bấy nhiêu, mà chi phí thì không rõ ràng.
Bên trái là một đống sức mạnh tính toán không ai sử dụng, bên phải là một đống người cần sức mạnh tính toán, ở giữa không có gì - hoặc nói cách khác, KeyCompute muốn làm cái chỗ giữa không có gì đó.

KeyCompute là gì
Nói đơn giản: một nền tảng dịch vụ sức mạnh AI.
Nói phức tạp: một nền tảng cho phép bạn biến máy tính nhàn rỗi thành nút tính toán, đồng thời cũng cho phép bạn gọi các mô hình lớn theo nhu cầu.
Nhưng nếu bạn để tôi nói một cách đơn giản nhất, KeyCompute đang làm điều này - sử dụng logic của闲鱼 trên sức mạnh tính toán.
Nhà bạn có sức mạnh tính toán không dùng hết, người khác cần sức mạnh tính toán, KeyCompute xây dựng cây cầu này, máy của bạn chạy mô hình cho người khác, nền tảng thanh toán, bạn nhận tiền, tương tự như đưa phòng nhàn rỗi lên nền tảng Airbnb, chỉ khác là bạn đưa CPU và GPU ra, đến ở không phải là khách du lịch, mà là một đống Token.
Đối với những bên gọi, KeyCompute lại là một chuyện khác: tất cả các mô hình lớn chính thống (GPT, Claude, Gemini, DeepSeek, Llama) đều dùng một API chuẩn để gọi, một Key quản lý tất cả, không cần phải đăng ký tài khoản khắp nơi, quản lý chi phí khắp nơi, xem mô hình nào hôm nay lại sập.
Vấn đề về nút tiêu dùng này khó hơn tưởng tượng
Bạn có thể nghĩ: không phải chỉ là máy tính cá nhân giúp người khác chạy mô hình sao, nghe có vẻ cũng không có gì đặc biệt.
Không phải thế.
Vấn đề đầu tiên: máy tính nhà bạn không có IP công cộng.
Đại đa số mạng băng thông gia đình, NAT xuyên thấu, địa chỉ nội mạng, nhà cung cấp không cho bạn mở IP công cộng, bạn muốn để yêu cầu của người khác đến gõ cửa nhà bạn, xin lỗi, số nhà không công khai, giao hàng không thể vào.
Cách làm của KeyCompute là để nút sử dụng "polling kiểu kéo" để kết nối - không phải chờ người khác đến tìm bạn, mà bạn chủ động hỏi server "Có việc gì không, có việc cho tôi không", lấy về chạy, chạy xong gửi kết quả về, như vậy nút không cần IP công cộng, tường của nhà cung cấp không ảnh hưởng đến bạn, băng thông thông thường vẫn kết nối được.
Vấn đề thứ hai: làm sao nếu nút không ổn định.
Máy tính của bạn hôm nay chạy mô hình, ngày mai bạn chơi game, ngày kia người nhà bạn xem video, ngày kế tiếp mất điện, nút bất cứ lúc nào cũng có thể biến mất, đó là số phận của thiết bị tiêu dùng.
Câu trả lời của KeyCompute là chuyển đổi lỗi tự động - nếu một nút biến mất, nhiệm vụ tự động được đưa lại vào hàng đợi, một nút khác tiếp nhận, người dùng không cảm thấy, hệ thống định tuyến luôn kiểm tra sức khỏe, chỉ gửi việc cho những cái còn sống, cái đã hỏng tự động bị loại bỏ.
Điều này gọi là tính khả dụng cao, hay đừng để người dùng biết về những rắc rối ở phía sau.
Một hóa đơn, tất cả các mô hình
Những người đã gọi API đều có một nỗi phiền muộn chung: hóa đơn phân tán ở bảy, tám nơi.
Hóa đơn của OpenAI ở Mỹ, nạp tiền phải có thẻ Visa, thanh toán bằng USD, còn phải dùng VPN, hóa đơn của Anthropic lại ở một nơi khác, quy trình nạp khác, DeepSeek giờ trong nước có thể dùng trực tiếp, nhưng hóa đơn của nó lại không khớp với hai cái trên.
Cuối cùng bạn duy trì bốn, năm tài khoản, bốn, năm API Key, bốn, năm hệ thống tính phí, mỗi tháng thời gian đối账 còn lâu hơn thời gian gọi thực tế.
KeyCompute đã thống nhất việc này.
Tất cả các mô hình, một định dạng API tương thích với OpenAI chuẩn, chỉ cần đổi endpoint là xong, mã gọi GPT ban đầu, chỉ cần thay một dòng URL, lập tức có thể chuyển sang DeepSeek hoặc Gemini, nạp tiền qua Alipay WeChat, thanh toán bằng nhân dân tệ, hóa đơn tính theo từng yêu cầu chính xác đến từng Token tiêu thụ, không cần đoán.
Mỗi lần gọi đều khóa giá theo thời điểm gọi, tức là, bạn gọi hôm nay, tính theo giá hôm nay, ngay cả khi ngày mai nền tảng tăng giá, yêu cầu hôm qua không bị truy hồi, đây là điều cơ bản nên có.
Cái "phân phối cấp hai" đó là cái quái gì?
Trang sản phẩm ghi "hệ thống phân phối cấp hai".
Vừa thấy bốn chữ này, bạn có thể đã nghe thấy nhạc nền của một số công ty bán hàng đa cấp trong đầu.
Đừng vội.
Logic phân phối ở đây thực ra rất đơn giản: bạn giới thiệu KeyCompute cho bạn bè, bạn bè đăng ký sau mỗi lần tiêu dùng, bạn nhận một tỷ lệ hoa hồng nhất định, không phải là kéo nhân viên cấp dưới, mà là phần thưởng giới thiệu thông thường, cơ chế mã mời, hầu hết các sản phẩm SaaS đều có điều này.
Trong lĩnh vực API AI này, hoa hồng dựa trên lượng tiêu dùng thực sự hợp lý - bạn đã giới thiệu một người bạn gọi 1 triệu Token mỗi tháng, thật sự nên nhận nhiều hơn so với một người bạn giới thiệu đăng ký xong không bao giờ đăng nhập.
Nhưng nếu bạn thực sự có ý định dựa vào điều này làm chính, tôi vẫn khuyên bạn nên suy nghĩ tại sao bạn có nhiều bạn bè muốn sử dụng AI API như vậy.
Vấn đề về stack công nghệ
KeyCompute được viết bằng Rust.
Đây là một lựa chọn khiến kỹ sư cảm thấy "wow", còn khiến người không phải kỹ sư cảm thấy "thì sao".
Lý do sử dụng Rust thường chỉ có một: yêu cầu hiệu suất cao, không thể có gián đoạn GC, an toàn bộ nhớ không thể dựa vào may rủi, trong kịch bản như gateway API AI - độ truy cập cao, độ trễ thấp, mỗi yêu cầu đều tính phí - đúng là Rust có ưu thế hơn.
Backend Axum, frontend Dioxus (cũng là framework frontend của Rust, tư tưởng tương tự như React nhưng viết bằng Rust), database PostgreSQL, cache Redis.
Toàn bộ stack tương đối hiện đại, Docker Compose có thể khởi động chỉ với một cú nhấp chuột, đối với đội ngũ kỹ thuật thì chi phí học hỏi không cao.
Ai sẽ là người sử dụng
Nhà phát triển cá nhân: không muốn quản lý nhiều tài khoản API, muốn gọi thống nhất, thanh toán bằng nhân dân tệ, nạp trực tiếp trong nước, KeyCompute sẽ dễ dàng hơn so với việc tự đứng ra nạp USD.
Các doanh nghiệp nhỏ và vừa: có nhiều dòng kinh doanh liên quan đến AI, cần quản lý thống nhất quyền và lượng sử dụng API Key, không muốn các đội ngũ tự làm tài khoản.
Những người có sức mạnh tính toán nhàn rỗi: có PC nhàn rỗi hiệu suất tốt ở nhà hoặc công ty, cài đặt một client nhẹ, kết nối với pool nút, có yêu cầu thì chạy, không có yêu cầu thì dùng máy bình thường, thu nhập thụ động, nhưng lợi nhuận phụ thuộc vào lượng yêu cầu thực tế của nền tảng, giai đoạn đầu không nên kỳ vọng quá cao.
Đối tác hợp tác hệ sinh thái: có nhóm người dùng liên quan đến AI, muốn nhanh chóng triển khai một dịch vụ trung chuyển API, sử dụng cơ sở hạ tầng của KeyCompute để tiết kiệm chi phí tự xây dựng, dựa vào hệ thống phân phối để thu lợi.
Nói một câu cuối cùng
Khi vấn đề này được thảo luận nghiêm túc lần đầu tiên, mọi người đều nghĩ rằng: "Có quá nhiều sức mạnh tính toán nhàn rỗi, sao không sử dụng?"
Sau đó phát hiện ra: việc sử dụng hai từ này phía sau có một đống vấn đề kỹ thuật cần giải quyết, không có IP công cộng thì làm sao kết nối, nút không ổn định thì làm sao điều phối, tính phí thì làm sao đối账, nhiều mô hình thì làm sao thống nhất, mỗi cái đều là vấn đề có thể viết thành một bài viết kỹ thuật.
Định hướng của KeyCompute là đúng - nhu cầu sức mạnh AI đang tăng, tài nguyên tính toán nhàn rỗi cũng đang tăng, hai điều này xảy ra đồng thời, giữa chúng nên có một nền tảng.
Còn liệu có làm được hay không, còn phải xem cách thực hiện.
Dù sao, những dự án đúng hướng cũng chết nhiều, mà những dự án sai hướng vẫn sống sót cũng không ít, điều này không liên quan đến sức mạnh tính toán của PC bạn, cũng không liên quan đến việc PC bạn mỗi ngày phơi nắng.
Nhưng ít nhất, nó đang làm một điều có ý nghĩa.
Cái máy tính nhàn rỗi của bạn, có thể không có sự đãi ngộ này.
GitHub:
github.com/keycompute/keycompute
Thông tin liên hệ:
keycompute@163.com

#KeyCompute #GPT #Claude #DeepSeek #AI算力
Nội dung bạn quan tâm trên OpenSea
Duyệt | Tạo | Mua | Bán | Đấu giá

Theo dõi kênh OpenSea Binance
Nắm bắt thông tin mới nhất

