
Tenho um amigo programador que montou uma estação de trabalho com uma configuração bem legal.
RTX 4090, 64G de RAM, comprei com alguns meses de salário, e para que eu uso no dia a dia?
Reunião.
Depois da reunião, só relaxo, desligo no final do expediente, é isso.
Uma máquina que consegue rodar o DeepSeek, fazer deploy do Llama e sustentar meio aplicativo de IA, sua principal missão diária é receber três mensagens no DingTalk pela manhã e depois entrar em modo de descanso.
Isso não é chamado de poder de computação, isso é um cemitério de poder de computação.
Esse problema é maior do que você imagina.
Você pode achar que isso é apenas um desperdício pessoal, sem relação com o mundo.
Mas fiz as contas, a China tem cerca de 700 milhões de PCs, e uma boa parte tem uma taxa média de uso que não passa de 20%. E o que acontece com os outros 80% do tempo?
Em modo de espera, bloqueio de tela, modo de proteção, depois que a tela se apaga, a diferença deles para um tijolo é que o tijolo não tem ventilador.
Por outro lado, empresas de IA estão gastando fortunas em GPUs.
Grandes empresas estão competindo por servidores, equipes menores não conseguem arcar, chamadas de API são caras, e a implementação privada também é cara, se você quer rodar um grande modelo - esqueça, continue usando a API, pagando por token, quanto mais você usa, mais você gasta, e isso é difícil de calcular.
À esquerda, há uma pilha de poder de processamento sem uso, à direita, uma pilha de pessoas que precisam de poder de processamento, e no meio, nada - ou seja, o KeyCompute quer ser esse meio que não existe.

O que é o KeyCompute
Resumindo: é uma plataforma de serviços de poder de computação de IA.
Dito de maneira complexa: uma plataforma que permite que você transforme um computador ocioso em um nó de computação, ao mesmo tempo que também permite que você chame vários grandes modelos sob demanda.
Mas se você me pedir para ser bem direto, o que o KeyCompute faz é - aplicar a lógica de mercado de pulgas no poder de computação.
Se você tem poder de processamento ocioso em casa e outros precisam, o KeyCompute faz essa ponte, sua máquina roda modelos para os outros, a plataforma faz a liquidação, você recebe o pagamento, é como alugar um quarto ocioso em uma plataforma de hospedagem, só que você está alugando CPU e GPU, e os hóspedes não são turistas, mas um monte de tokens.
Para quem faz as chamadas, o KeyCompute é outra história: todos os grandes modelos (GPT, Claude, Gemini, DeepSeek, Llama) usam uma interface de API padrão, uma chave que controla tudo, sem precisar registrar várias contas, gerenciar custos ou ficar de olho em qual modelo caiu hoje.
A questão dos nós de consumo é mais complicada do que parece
Você pode pensar: não é só um PC ajudando a rodar modelos, parece simples.
Não é isso.
A primeira questão: seu PC não tem IP público.
A grande maioria das conexões de banda larga em casa, com NAT, endereços internos, e os provedores não permitem que você abra IP público, se você quer que os pedidos de outros cheguem até você, desculpe, o número não é público, a entrega não pode ser feita.
A abordagem do KeyCompute é fazer os nós se conectarem via "polling" - não é esperar que os outros venham até você, mas sim você ir até o servidor perguntar "tem trabalho?" e, se houver, você processa e devolve o resultado, assim os nós não precisam de IP público, o bloqueio do provedor não te afeta, e uma conexão de banda larga comum funciona.
A segunda questão: o que fazer com nós instáveis?
Hoje sua máquina roda modelos, amanhã você vai jogar, depois alguém da família vai assistir vídeo, e depois pode ter queda de energia, os nós podem sumir a qualquer momento, essa é a sina dos dispositivos de consumo.
A resposta do KeyCompute é a transferência automática de falhas - se um nó desaparece, a tarefa é automaticamente reencaminhada, outro nó assume, e o usuário não percebe, o sistema de roteamento está sempre fazendo checagens de saúde, só dá trabalho aos que estão ativos, os que falharam são automaticamente excluídos.
Isso se chama alta disponibilidade, ou seja, não deixe os usuários saberem as complicações nos bastidores.
Uma fatura, todos os modelos
Quem já trabalhou com API tem uma preocupação comum: as faturas estão espalhadas em sete ou oito lugares.
A fatura da OpenAI está nos EUA, o pagamento exige um cartão Visa, em dólares, e ainda precisa de VPN, a fatura da Anthropic está em outro lugar, com um processo de recarga diferente, e a DeepSeek agora pode ser usada diretamente na China, mas sua fatura não confere com as duas anteriores.
Por fim, você vai manter quatro ou cinco contas, quatro ou cinco chaves de API, quatro ou cinco sistemas de cobrança, e o tempo que você gasta reconciliando no final do mês é maior do que o tempo real de chamadas.
O KeyCompute unificou isso.
Todos os modelos, um formato de API padrão compatível com OpenAI, mude apenas o endpoint e pronto, o código que chamava o GPT, altere uma linha de URL e você pode imediatamente usar DeepSeek ou Gemini, recarga via Alipay e WeChat, pagamento em RMB, a fatura é precisa até cada token consumido, sem adivinhações.
Cada chamada bloqueia uma captura de preço no momento da chamada, ou seja, se você chamar hoje, será cobrado pelo preço de hoje, mesmo que amanhã a plataforma aumente o preço, os pedidos de ontem não são retroativos, isso é o mínimo que se espera.
O que é esse "sistema de distribuição secundário"?
Na página do produto, está escrito "sistema de distribuição secundário".
Ao ver essas quatro palavras, você pode já estar ouvindo na sua cabeça a música tema das reuniões matinais de certas empresas de marketing.
Calma aí.
A lógica de distribuição aqui é bem simples: você recomenda o KeyCompute para um amigo, ele se registra e toda vez que consome, você recebe uma certa porcentagem de comissão, não é uma rede de afiliados, mas uma recompensa de recomendação comum, a maioria dos produtos SaaS tem isso.
Nesse mercado de APIs de IA, a recompensa por recomendação baseada no uso é bastante razoável - se você recomendou alguém que usa 1 milhão de tokens por mês, você deve receber mais do que por alguém que se registrou e nunca mais fez login.
Mas se você realmente pretende fazer disso seu principal negócio, eu ainda sugiro que você pense no motivo pelo qual você tem tantos amigos que estão dispostos a usar APIs de IA.
Sobre a pilha tecnológica
O KeyCompute foi escrito em Rust.
Essa é uma escolha que faz os engenheiros pensarem "uau", e os não engenheiros pensarem "e daí?".
A razão para usar Rust geralmente é uma só: altas exigências de desempenho, sem pausas de GC, segurança de memória não pode depender da sorte, em cenários como um gateway de API de IA - alta concorrência, baixa latência, cada chamada sendo cobrada - realmente o Rust se destaca.
Backend Axum, frontend Dioxus (também um framework frontend em Rust, com uma abordagem similar ao React, mas escrito em Rust), banco de dados PostgreSQL, cache Redis.
Toda a pilha é relativamente moderna, o Docker Compose sobe com um clique, e o custo de entrada para equipes técnicas não é alto.
Para quem é adequado
Desenvolvedores individuais: não querem gerenciar várias contas de API, querem uma chamada unificada, pagamento em RMB, recarga direta no país, o KeyCompute é mais prático do que usar a VPN para recarregar em dólares.
Pequenas e médias empresas: com várias linhas de negócio relacionadas à IA, precisam gerenciar unificadamente as permissões e o uso das chaves de API, sem querer que cada equipe gerencie suas próprias contas.
Para quem tem poder de processamento ocioso: se você tem um PC com bom desempenho parado em casa ou no trabalho, instale um cliente leve, conecte-se a um pool de nós, e quando houver chamadas, você roda, se não tiver, usa a máquina normalmente, gerando uma renda passiva, mas os ganhos dependem do volume real de chamadas na plataforma, então não espere muito no começo.
Parceiros ecológicos: têm um público relacionado à IA, querem rapidamente lançar um serviço de intermediação de API, aproveitando a infraestrutura do KeyCompute para economizar custos de construção, lucrando com o sistema de distribuição.
Por último, uma última palavra
Quando essa questão foi discutida pela primeira vez, a ideia era: "Há tanto poder de processamento ocioso, por que não aproveitá-lo?"
Aí você percebe: usar essas duas palavras esconde uma série de problemas de engenharia a serem resolvidos, como acessar sem IP público, como gerenciar nós instáveis, como reconciliar cobrança, como padronizar múltiplos modelos, cada um desses problemas poderia render um artigo técnico separado.
A direção do KeyCompute está certa - a demanda por poder de computação de IA está crescendo, o recurso computacional ocioso está crescendo, e essas duas coisas acontecendo simultaneamente indicam que deve haver uma plataforma no meio.
Quanto a conseguir fazer isso, depende da execução.
Afinal, projetos com a direção correta também falham, e projetos com a direção errada sobrevivem, isso não tem nada a ver com o poder de processamento do seu PC, e nem com o fato de seu PC estar pegando sol todo dia.
Mas pelo menos, está fazendo algo significativo.
Seu computador ocioso pode não ter esse tratamento.
GitHub:
github.com/keycompute/keycompute
Contato:
keycompute@163.com

#KeyCompute #GPT #Claude #DeepSeek #AI算力
Conteúdo do OpenSea que você se preocupa
Navegar | Criar | Comprar | Vender | Leiloar

Colecione e siga o canal OpenSea e Binance
Fique por dentro das últimas notícias

