Relatório de pesquisa aprofundada da conferência GTC da NVIDIA: Lógica subjacente do objetivo de pedidos de trilhões, gargalos de implementação e reconfiguração da estrutura da indústria

Data do relatório: abril de 2026
Escopo da pesquisa: Publicação central da NVIDIA na conferência GTC de 2026, estrutura de oferta e demanda da indústria de IA, cadeia de suprimentos de semicondutores, cenário competitivo de chips de IA, transformação do modelo de negócios da indústria de IA
Declaração central: Este relatório é apenas para pesquisa e análise da indústria, não constitui qualquer conselho de investimento
ResumoNa conferência GTC da NVIDIA de 2026, o fundador da empresa, Jensen Huang, apresentou o objetivo central: até o final de 2027, o volume total de pedidos das duas plataformas Blackwell e Vera Rubin ultrapassará 1 trilhão de dólares, um objetivo que atraiu ampla atenção da indústria global de tecnologia e semicondutores. Este relatório combina a experiência de primeira linha de investidores da indústria de IA, ex-chefe de pesquisa e desenvolvimento da NVIDIA, arquitetos de chips de elite e operadores de infraestrutura de nuvem de GPU, analisando profundamente a lógica de suporte subjacente a esse objetivo de trilhões, os gargalos centrais no processo de implementação, a evolução das defesas centrais da empresa, bem como seu impacto disruptivo na estrutura da indústria de potência de IA global, cadeia de suprimentos de semicondutores e modelo de negócios de serviços corporativos.
Pesquisas mostram que a meta de um trilhão de dólares da Nvidia é fundamentalmente sustentada pela mudança na estrutura de custos do poder computacional de IA, de "orientado ao treinamento" para "orientado à inferência", e pelo aumento na demanda por tokens impulsionado pela explosão da inteligência artificial. A principal restrição para atingir essa meta mudou das capacidades de design de chips para gargalos físicos, como a capacidade de produção de toda a cadeia de suprimentos de semicondutores e a infraestrutura de energia dos data centers. No curto prazo, a posição de liderança da Nvidia em poder computacional de IA dificilmente será abalada, e seu ecossistema completo e o controle da cadeia de suprimentos continuam sendo suas principais vantagens competitivas. No médio e longo prazo, o mercado global de poder computacional formará gradualmente um cenário diversificado e heterogêneo, com a IA de borda e a implantação de agentes em nível empresarial se tornando novas direções de crescimento e principais vias competitivas para o setor.
I. Principais ConclusõesA meta de um trilhão de dólares tem um claro suporte da demanda, e sua velocidade de implementação depende da taxa de penetração do setor de Agentes: os pedidos de um trilhão de dólares da Nvidia não são meras expectativas de vendas, mas um passo fundamental em sua transformação estratégica de fabricante de GPUs para operadora de infraestrutura de IA. A demanda por inferência tornou-se o principal motor do crescimento a longo prazo do poder computacional de IA. Estima-se que, nos próximos 1 a 2 anos, os custos de inferência representarão de 70% a 80% do custo total do poder computacional. A implantação em larga escala de agentes inteligentes impulsionará o rápido crescimento da demanda por tokens, fornecendo a garantia de demanda essencial para a meta de um trilhão de dólares.
Os gargalos em toda a cadeia de suprimentos são a principal restrição para atingir a meta de um trilhão de dólares: a expansão da capacidade da indústria de semicondutores tem um ciclo rígido, e o processo de 3nm da TSMC, a capacidade de encapsulamento avançado CoWoS, o fornecimento de memória HBM de alta largura de banda e as capacidades de infraestrutura e distribuição de energia de data centers são os quatro principais gargalos que restringem a implantação de poder computacional. A escassez de componentes de suporte em toda a cadeia da indústria deve continuar até o final de 2027, impactando diretamente o cronograma de entrega de pedidos da Nvidia e o alcance de sua meta.
A principal vantagem competitiva da NVIDIA foi aprimorada, e é improvável que um único avanço tecnológico abale sua posição de liderança: a principal barreira competitiva da empresa foi ampliada, passando do ecossistema de software CUDA para uma vantagem abrangente que inclui "recursos de design de chips orientados por IA + ecossistema completo de software e hardware + controle absoluto sobre a cadeia de suprimentos + ecossistema de desenvolvedores". Embora o Coding Agent reduza o limite para a otimização do kernel CUDA subjacente, ele não consegue replicar seus recursos de otimização em nível de sistema completo nem a coesão do ecossistema.
O mercado global de poder computacional se tornará mais diversificado e heterogêneo, limitando as oportunidades para startups em chips de inferência de uso geral: os futuros sistemas de computação de IA formarão uma arquitetura híbrida heterogênea de "GPU + LPU + CPU + interconexão óptica". Os TPUs do Google, a série MI da AMD e os chips desenvolvidos internamente por fornecedores de nuvem ocuparão uma certa parcela de mercado em cenários específicos, atenuando o monopólio absoluto da Nvidia. No entanto, as oportunidades para startups no setor de chips de inferência de uso geral estão essencialmente fechadas. A principal oportunidade de desenvolvimento para startups reside em complementar o ecossistema da Nvidia e na inovação colaborativa em sub-setores específicos.
O modelo AaaS irá remodelar os negócios de serviços corporativos, pressionando o SaaS tradicional a se transformar: a maturidade da tecnologia de agentes impulsionará a transição dos serviços corporativos de um modelo SaaS padronizado para um modelo AaaS altamente personalizado. O investimento central das empresas migrará da aquisição de software de TI para a aquisição de mão de obra de IA. Fornecedores com experiência no setor e capacidade de otimização de poder computacional obterão novas oportunidades de crescimento, enquanto os fornecedores tradicionais de SaaS que não possuem recursos de modelagem de IA correrão o risco de serem substituídos.
II. Contexto da PesquisaA conferência NVIDIA GTC, que será realizada em março de 2026, é um importante indicador de tendências para a indústria global de IA e semicondutores. Durante a conferência, Jensen Huang propôs uma meta fundamental que impactará o setor: até o final de 2027, o volume acumulado de pedidos das plataformas Blackwell e Vera Rubin será de pelo menos US$ 1 trilhão.
O impacto dessa meta na indústria não pode ser ignorado: em 2024, as vendas anuais da indústria global de semicondutores ultrapassaram apenas US$ 600 bilhões. A Nvidia planeja superar as vendas anuais da indústria global de semicondutores em três anos, alavancando sua empresa única e duas plataformas de produtos principais. Por trás dessa meta reside a principal contradição da atual indústria de IA: a demanda por poder computacional está experimentando um crescimento explosivo, atingindo trilhões de dólares, enquanto o lado da oferta enfrenta gargalos rígidos em toda a cadeia, desde a capacidade de fabricação de wafers avançados e processos de embalagem até chips de memória e distribuição de energia.
Simultaneamente, nesta conferência GTC, a NVIDIA concluiu o maior lançamento simultâneo de produtos da sua história: a plataforma Vera Rubin lançou 7 novos chips produzidos em massa de uma só vez, com eficiência de inferência 10 vezes maior que a plataforma Blackwell e custo por chip reduzido a 1/10 do original; apenas 4 meses após concluir a aquisição da Grok, lançou oficialmente o chip de inferência LPU, consolidando sua posição no segmento de inferência de baixa latência; ao mesmo tempo, lançou o ecossistema de software Nemo Cloud, com foco no ponto de entrada principal para a implantação de agentes em nível empresarial, completando o layout de pilha completa, do hardware ao software, do treinamento à inferência e dos chips à infraestrutura de data center.
Este relatório realiza um estudo aprofundado sobre a viabilidade, o impacto e a transformação da indústria em relação à meta de um trilhão de dólares da Nvidia, fornecendo referências abrangentes e objetivas para participantes e investidores do setor.
III. A lógica subjacente que sustenta a meta de encomendas de um trilhão de dólares da Nvidia3.1 Uma reestruturação fundamental do posicionamento estratégico: de fabricante de GPUs a operador de infraestrutura de IAA meta de um trilhão de dólares de Jensen Huang não se resume simplesmente a expandir as vendas de chips; seu cerne é o reposicionamento completo dos negócios da Nvidia — transformando-a da maior empresa de design de chips de GPU do mundo em uma operadora de infraestrutura para a era da inteligência artificial, criando uma fábrica de poder computacional de IA que abrange toda a indústria.
Zhang Lu, sócio-fundador da Fusion Fund, afirmou que o principal produto comercial da Nvidia não é mais o hardware de GPUs, mas sim a principal fonte de produtividade da era da IA: os tokens. Essa mudança de posicionamento permite que a Nvidia supere as limitações de mercado dos chips semicondutores tradicionais e se alinhe precisamente com as oportunidades de crescimento a longo prazo da transformação da IA ​​em toda a economia digital.
Do ponto de vista do modelo de negócios, a NVIDIA evoluiu de "vender produtos de hardware" para "fornecer soluções completas de infraestrutura de computação". Na conferência GTC deste ano, a NVIDIA não apenas lançou chips, mas também uma solução modular pré-fabricada para data centers de IA, reduzindo o ciclo de construção de data centers de 18 a 20 meses para 6 a 9 meses. Essencialmente, isso oferece aos clientes uma fábrica de poder computacional de IA "pronta para uso", concretizando uma atualização do modelo de negócios, passando da venda de chips individuais para o fornecimento de serviços de infraestrutura de ciclo de vida completo e fornecendo um sólido suporte lógico para sua meta de pedidos na casa dos trilhões de dólares.
3.2 Inversão da estrutura de custos computacionais: a demanda por inferência torna-se o principal motor do crescimento a longo prazo.A principal lógica de demanda que sustenta a meta de um trilhão de yuans é a mudança fundamental na estrutura de custos do poder computacional de IA: o custo do poder computacional do setor passou rapidamente de "orientado ao treinamento" para "orientado à inferência", e a demanda por inferência se tornará uma fonte de fluxo de caixa estável, de longo prazo e em larga escala para o poder computacional de IA.
Nos estágios iniciais do desenvolvimento da indústria de IA, os custos de poder computacional do setor concentravam-se principalmente na fase de pré-treinamento de grandes modelos. Em 2023, 70% a 80% dos custos de poder computacional em chips do setor foram investidos em treinamento de modelos. O treinamento é um investimento único em ativos fixos, e a demanda concentra-se em alguns grandes fabricantes de modelos, portanto, o potencial de crescimento é relativamente limitado.
Com a maturidade da tecnologia de modelos de grande porte, a proporção do custo de inferência está aumentando rapidamente: atualmente, os custos de treinamento e inferência dos principais fornecedores de modelos de grande porte são basicamente iguais; estima-se que, em 2025-2026, o custo de inferência representará de 70% a 80% do custo total da capacidade computacional de IA, tornando-se o gasto mais significativo do setor.
Os dados divulgados por Jensen Huang na conferência também confirmam essa tendência: nos últimos dois anos, o volume de computação inferencial aumentou 10.000 vezes, o uso de tokens aumentou 100 vezes e a demanda geral por computação aumentou 1 milhão de vezes, e esse ritmo de crescimento continua. Ao contrário do investimento único em treinamento, a demanda por inferência é contínua e de alta frequência, e continua a crescer com a penetração de aplicações de IA, fornecendo suporte estável e de longo prazo para a meta de pedidos de um trilhão de dólares da NVIDIA.
3.3 A explosão de agentes inteligentes baseados em agentes impulsiona um crescimento exponencial na demanda por tokens.O aumento na demanda por inferência é impulsionado principalmente pela implantação em larga escala de agentes inteligentes. Ao contrário das chamadas tradicionais de modelos únicos e complexos, os agentes inteligentes exigem operação online contínua, resposta em tempo real e interações em múltiplas rodadas, impondo maiores exigências em termos de baixa latência, processamento de contexto extenso e recursos de geração de tokens de usuário único com alta concorrência, o que leva diretamente a um aumento significativo no consumo de tokens.
Na conferência GTC deste ano, "Open Cloud" foi uma das palavras-chave mais mencionadas por Huang Renxun, com o objetivo principal de se adaptar à implantação em larga escala de agentes inteligentes. Muitos especialistas do setor acreditam que os agentes se tornarão o principal meio de transmissão da próxima geração de serviços corporativos e da internet para o consumidor, depois dos PCs e da internet móvel, e sua demanda por poder computacional excederá em muito a dos aplicativos de internet tradicionais.
Em termos de velocidade de implantação, a taxa de penetração de aplicações Agent no mercado chinês ultrapassou a dos Estados Unidos. Os produtos Agent, representados pelo Doubao da ByteDance, alcançaram ampla adoção pelos usuários finais. Enquanto o mercado americano se concentra atualmente na codificação de IA em nível empresarial e no desenvolvimento de modelos multimodais, a implantação de Agents em nível empresarial está progredindo rapidamente. À medida que a tecnologia Agent amadurece, sua demanda por consumo de tokens se tornará um fator crucial para o crescimento da meta de pedidos de um trilhão de dólares da Nvidia.
IV. Principais gargalos e restrições da cadeia de suprimentos para atingir a meta de um trilhão de yuansPara concretizar encomendas de um trilhão de dólares, é fundamental superar as limitações físicas das indústrias de semicondutores e de infraestrutura. Muitos especialistas do setor acreditam que o principal obstáculo que atualmente impede a Nvidia de atingir sua meta de um trilhão de dólares não reside mais na capacidade de projetar chips, mas sim nas restrições de capacidade de toda a cadeia de suprimentos de semicondutores e nas rígidas limitações da infraestrutura de data centers.
4.1 Restrições de Capacidade Essenciais de Processos Avançados e EmbalagensNo processo de fabricação de wafers, o processo de 3 nm da TSMC é a base fundamental das plataformas Blackwell e Vera Rubin da Nvidia, e a capacidade de produção da TSMC determina diretamente o limite máximo de remessas de chips da Nvidia. Em comparação com a capacidade de wafers de 3 nm, um gargalo mais significativo é a capacidade de encapsulamento avançado CoWoS.
A tecnologia de encapsulamento avançado CoWoS é um processo fundamental para alcançar alta largura de banda e alto desempenho em chips de IA, sendo também um ponto fraco importante no atual setor de computação de IA. Desde 2024, a TSMC triplicou sua capacidade de CoWoS e continua expandindo, mas ainda não consegue atender à crescente demanda do setor.
Aproveitando sua sólida parceria com a TSMC, que já dura mais de duas décadas, a Nvidia garantiu uma parcela significativa da capacidade de produção de CoWoS da TSMC. Isso representa tanto uma vantagem crucial na cadeia de suprimentos quanto uma grande limitação para a expansão da capacidade produtiva. Mesmo com uma demanda de pedidos na casa dos trilhões de dólares, a expansão da capacidade de embalagem avançada da TSMC possui um ciclo rígido e não consegue alcançar um crescimento rápido no curto prazo, limitando diretamente a escala de remessas de chips da Nvidia.
4.2 Oferta restrita em toda a cadeia de suprimentos de chips de memóriaO desempenho dos chips de IA depende fortemente da memória de alta largura de banda (HBM), tornando-a um requisito fundamental na indústria de poder computacional para IA. Por volta da época desta conferência GTC, a Micron e a Samsung anunciaram o início oficial da produção em massa da HBM4. Enquanto isso, os três principais fabricantes — Micron, Samsung e SK Hynix — estão avançando com soluções personalizadas para HBM4e, visando atender às necessidades da plataforma de próxima geração da NVIDIA.
No entanto, a expansão da capacidade da HBM enfrenta limitações rigorosas de processo, e a capacidade restrita da HBM desencadeou uma reação em cadeia de escassez em toda a indústria de chips de memória: a capacidade de produção de chips de memória DDR e SSD foi comprimida pela HBM, e o preço dos chips de memória em todo o setor continuou a subir, com aumentos de 100% a 200% em produtos relacionados no último ano. De acordo com informações de primeira mão da cadeia de suprimentos, a escassez de chips de memória deverá continuar até o final de 2027, tornando-se um dos principais gargalos que restringem a expansão da capacidade computacional.
4.3 Tetos rígidos na infraestrutura de data centers e fornecimento de energiaOs pedidos da Nvidia, que somam trilhões de dólares, precisam ser implementados em data centers reais. Atualmente, o maior gargalo que restringe a implantação de poder computacional não são mais os próprios chips, mas sim a capacidade da infraestrutura dos data centers, especialmente o fornecimento de energia.
Alex, fundador da GMI Cloud, uma provedora líder global de serviços de nuvem com GPUs, afirmou que a principal restrição para atingir US$ 1 trilhão em receita é a velocidade de construção de data centers, e o principal gargalo nesse processo é a eletricidade. Atualmente, a rede elétrica pública dos EUA não possui capacidade de geração de energia industrial superior a 10 megawatts. 90% dos data centers recém-construídos adotam o modelo "Behind-the-Meter" (atrás do medidor) — ou seja, não utilizam a rede elétrica pública e constroem geradores a gás natural no local para alcançar a autossuficiência energética. Alguns dos principais provedores de nuvem chegaram a fretar usinas nucleares para fornecer energia dedicada aos seus data centers.
Os Estados Unidos não carecem de capacidade de geração de energia; o principal gargalo reside na distribuição de energia. A construção de subestações para a rede elétrica pública e a distribuição de eletricidade de alta tensão estão sujeitas a rígidas restrições regulatórias, com longos ciclos de aprovação e lentidão na implementação, o que impede o acompanhamento do ritmo de construção de data centers de IA. Essa rígida restrição determina diretamente o limite máximo da expansão da infraestrutura global de computação e afeta indiretamente o andamento da implementação dos pedidos trilionários da Nvidia.
4.4 Risco de escassez de componentes de apoio em toda a cadeia produtivaAlém dos chips principais, armazenamento e energia, toda a cadeia de infraestrutura de computação de IA enfrenta escassez de suprimentos. Dados operacionais em primeira mão mostram que a escassez atual se espalhou dos chips principais para toda a cadeia do setor: componentes essenciais como os switches CX7 da NVIDIA BlueField, CPUs de servidor da Intel, soluções de CDU com refrigeração líquida para data centers e módulos ópticos estão todos em falta, com os ciclos de entrega sendo continuamente estendidos.
Um servidor de IA de ponta contém mais de 200.000 componentes individuais. A escassez de qualquer um desses componentes afetará a entrega final do servidor e a implantação de poder computacional. Isso significa que a meta de um trilhão de dólares da Nvidia não pode ser alcançada sozinha. Ela exige a expansão simultânea de toda a cadeia produtiva de semicondutores, fabricação de eletrônicos e data centers, e a expansão coordenada de toda essa cadeia está sujeita a considerável incerteza.
V. Principais vantagens competitivas e capacidades de iteração tecnológica da NVIDIADiante da concorrência generalizada do setor e das restrições da cadeia de suprimentos, a capacidade da Nvidia de atingir a meta de um trilhão de dólares em pedidos depende do fortalecimento contínuo de suas barreiras tecnológicas e das vantagens de seu ecossistema completo. Nesta conferência GTC, as principais vantagens competitivas da Nvidia foram totalmente aprimoradas, formando uma força competitiva multidimensional.
5.1 Revolução no design de chips impulsionada por IA, acelerando significativamente a velocidade de iteração.Na conferência GTC deste ano, a NVIDIA lançou sete novos chips produzidos em massa para sua plataforma Vera Rubin, marcando seu maior lançamento simultâneo de produtos até hoje e quebrando o ritmo tradicional de iteração de produtos na indústria de semicondutores.
Há alguns anos, o ritmo padrão na indústria de semicondutores era lançar um chip principal a cada dois anos, e os principais fabricantes eram considerados líderes do setor se conseguissem lançar um ou dois novos chips por ano. A capacidade da Nvidia de desenvolver e produzir em massa vários chips por ano simultaneamente se deve principalmente à forte integração da IA ​​em todo o processo de design de chips.
O Dr. Mark Ren, ex-Diretor de Pesquisa da NVIDIA e fundador e CEO da Agentris, revelou que a NVIDIA adotou integralmente o Coding Agent internamente, melhorando significativamente a eficiência do trabalho dos engenheiros de design de chips. Em 2023, a NVIDIA lançou o Projeto Chip Nemo — baseado em mais de 20 bilhões de tokens de dados internos relacionados ao design de chips, o projeto treinou um modelo dedicado de grande porte que abrange todo o processo de design de chips, desde a interpretação dos requisitos de design e a geração de código RTL até a otimização do desempenho do chip e o ajuste do consumo de energia. A IA foi profundamente integrada a todos os aspectos do design de chips.
Os modelos tradicionais de aprendizado de máquina só conseguem resolver problemas locais no projeto de chips, enquanto a maturidade dos modelos de linguagem em larga escala e da tecnologia de agentes possibilitou a implementação de capacidades de projeto de chips em larga escala. Essa é também a principal capacidade que permite à NVIDIA avançar rapidamente no desenvolvimento simultâneo de múltiplos chips e encurtar continuamente o ciclo de iteração, criando uma vantagem em pesquisa e desenvolvimento difícil de ser replicada por outros fabricantes.
5.2 A inovação arquitetônica aborda as deficiências de inferência, e a LPU garante a próxima geração de poder computacional.Na conferência GTC deste ano, apenas quatro meses após adquirir a Grok, a NVIDIA lançou oficialmente seu chip de inferência LPU baseado na tecnologia Grok. Jensen Huang chegou a sugerir que "todos os data centers deveriam reservar 25% de seu espaço para chips de inferência representados pela Grok". Essa iniciativa demonstra que a NVIDIA preencheu completamente sua lacuna no campo da inferência de baixa latência e garantiu uma vantagem fundamental na arquitetura de computação de próxima geração.
O Dr. Xiao Zhibin, ex-arquiteto do chip Hanguang 800 da Alibaba, analisou as principais vantagens arquitetônicas da Grok LPU: os chips de IA tradicionais geralmente adotam a arquitetura DRAM, dependendo de memória externa de grande capacidade para armazenar os pesos do modelo, o que não só apresenta alta latência de acesso, como também requer atualização dinâmica; já a Grok LPU adota uma arquitetura SRAM on-chip pura, eliminando a DRAM e armazenando os pesos do modelo e o cache KV na SRAM on-chip, com uma latência de acesso de apenas 1 a 2 nanossegundos. Ela permite a expansão do cluster por meio de interconexões on-chip eficientes, adaptando-se bem aos requisitos de baixa latência das aplicações de agentes.
A lógica subjacente à inferência de modelos complexos consiste em duas etapas: codificador e decodificador. O codificador é adequado para processamento em lote de alto desempenho em GPUs, enquanto o decodificador é um processo de geração serial de tokens. Cada geração de token requer a leitura repetida dos pesos do modelo, com a maior parte do tempo gasto na comunicação entre os pesos, e não na computação em si. A LPU Grok coloca todos os pesos no chip, eliminando completamente a sobrecarga de comunicação. Em cenários de geração de tokens por um único usuário, sua eficiência é mais de 30 vezes superior à das GPUs.
Muitos especialistas do setor acreditam que os futuros sistemas de computação de IA serão inevitavelmente arquiteturas híbridas heterogêneas — GPUs para processamento em lote de codificadores e LPUs para geração de decodificadores com baixa latência, com diferentes arquiteturas de chip adaptando-se a diferentes operadores e cenários. A Nvidia, por meio da aquisição da Grok, garantiu uma vantagem fundamental em arquiteturas de inferência de próxima geração, consolidando ainda mais sua posição de liderança no mercado de poder computacional para todos os cenários.
5.3 A Evolução das Barreiras do Ecossistema CUDA: A Dificuldade de Replicar um Ecossistema Full-StackA principal vantagem da NVIDIA nas últimas duas décadas tem sido seu ecossistema de software centrado em CUDA. Com o rápido desenvolvimento dos Agentes de Codificação (Coding Agents), o setor passou a enxergar que "as barreiras de entrada para o CUDA estão diminuindo". Este relatório constata que, embora os Agentes de Codificação tenham de fato reduzido as barreiras de entrada para a otimização do kernel CUDA subjacente, a vantagem competitiva da NVIDIA evoluiu de uma única camada de software CUDA para um ecossistema de infraestrutura de IA completo, uma vantagem que continua difícil de replicar.
Do ponto de vista técnico, o código CUDA gerado por IA já consegue atingir mais de 90% do desempenho necessário para a otimização manual, e o limite para a otimização em nível de kernel está de fato diminuindo. No entanto, a principal vantagem da NVIDIA reside em sua experiência em design de hardware, dados de depuração em nível de sistema e recursos de otimização de ponta a ponta. Esses dados e essa experiência essenciais não podem ser obtidos pelo Coding Agent, nem podem ser replicados por outros fabricantes.
Do ponto de vista do ecossistema, a vantagem do CUDA reside não apenas na tecnologia em si, mas também na maior comunidade de desenvolvedores de GPUs do mundo que ela fomentou. Por meio do seu Programa Inception, a NVIDIA apoiou mais de 20.000 startups desde 2017, criando uma poderosa comunidade de desenvolvedores e uma grande influência no ecossistema. Mesmo que outros fornecedores repliquem a funcionalidade do CUDA, terão dificuldade em construir um ecossistema de desenvolvedores tão massivo em curto prazo.
Mais importante ainda, nesta conferência GTC, o modelo de ecossistema da NVIDIA se expandiu das ferramentas de desenvolvimento subjacentes até a camada de aplicação do Agente, lançando o ecossistema de software Nemo Cloud, alcançando integração completa com o Open Cloud, focando no ponto de entrada principal para implantação do Agente em nível empresarial, buscando o direito de definir as regras do setor na era do Agente e completando um ciclo fechado de ecossistema completo, desde as ferramentas subjacentes até os aplicativos de camada superior. Essa vantagem do ecossistema vai muito além do que uma simples cópia do CUDA pode proporcionar.
5.4 Principais vantagens do controle da cadeia de suprimentosOutra vantagem fundamental da Nvidia é o seu controle absoluto sobre a cadeia de suprimentos de semicondutores. Com a maior escala de aquisição de chips de IA do mundo e mais de 20 anos de profunda cooperação com a TSMC, a Nvidia garantiu a maior parte do processo de 3nm e da capacidade de embalagem avançada CoWoS da TSMC, uma barreira que concorrentes como AMD e Google terão dificuldade em superar no curto prazo.
Mesmo que empresas como a AMD e o Google garantam encomendas de clientes, terão dificuldades para competir com a Nvidia em processos de fabricação avançados e capacidade de embalagem. Enquanto isso, a Nvidia está avançando com um modelo de múltiplas fundições, utilizando principalmente a TSMC, complementada pela Samsung e pela Intel, para expandir ainda mais sua cadeia de suprimentos e aumentar a estabilidade. Esse controle acumulado ao longo dos anos sobre a cadeia de suprimentos é um suporte crucial para a Nvidia atingir sua meta de encomendas de um trilhão de dólares e uma vantagem fundamental que outros concorrentes têm dificuldade em replicar.
VI. Análise do cenário competitivo do setor e das oportunidades de mercado6.1 O mercado global de poder computacional formará um cenário diversificado e heterogêneo, com a posição de liderança da Nvidia permanecendo sólida.Este relatório argumenta que o futuro mercado de poder computacional de IA não formará um monopólio absoluto dominado pela Nvidia, mas sim um cenário diversificado e heterogêneo caracterizado pela "liderança da Nvidia e múltiplos fornecedores competindo em cenários diferenciados".
Do ponto de vista da concorrência, o TPU do Google, com seu próprio sistema de otimização full-stack, tem um custo de treinamento de apenas 1/3 do ChatGPT e um desempenho excelente. No entanto, essa vantagem se limita ao ecossistema do Google, e empresas terceirizadas têm dificuldade em alcançar os mesmos resultados de otimização. Os chips da série MI da AMD estão gradualmente conquistando o mercado de computação de baixo a médio porte e já ganharam uma certa participação em cenários de inferência. Grandes fornecedores de nuvem e de modelos, como OpenAI, Meta e Amazon, estão investindo no desenvolvimento de seus próprios chips e personalizando-os para seus cenários específicos, o que terá um impacto significativo na participação de mercado da Nvidia.
No entanto, a curto prazo, a posição de liderança da Nvidia permanece inabalável. Sua principal vantagem reside na capacidade, como provedora de serviços terceirizada, de oferecer otimização completa em nível de sistema para clientes com necessidades diversas em diferentes setores — uma capacidade que outros fornecedores focados em seus próprios ecossistemas têm dificuldade em superar. Além disso, seu ecossistema completo, eficiência em P&D e controle da cadeia de suprimentos continuam sendo líderes do setor.
6.2 A janela de oportunidade para startups em chips de inferência de uso geral está praticamente fechada, mas ainda existem oportunidades em setores de nicho.Com a forte presença da Nvidia na área de inferência, a indústria está acompanhando de perto se as startups de chips de IA ainda têm chances de crescer.
Muitos especialistas do setor acreditam que as oportunidades empreendedoras no segmento de chips de inferência de uso geral estão praticamente esgotadas, mas ainda há um espaço considerável para inovação e cooperação nos sub-setores prioritários não essenciais da NVIDIA e em áreas onde ela apresenta fragilidades.
No mercado de chips de inferência de uso geral, a NVIDIA alcançou a otimização completa da infraestrutura de IA e possui fortes capacidades internas de inovação. Em suas áreas principais, as startups têm dificuldade em competir com ela em termos de investimento de recursos e eficiência de iteração. Enquanto isso, a fidelização dos desenvolvedores ao ecossistema CUDA também dificulta a aceitação no mercado de chips de uso geral de startups.
A principal oportunidade de desenvolvimento para startups reside em evitar as áreas de negócio principais da Nvidia e concentrar-se em áreas onde a Nvidia tem prioridades não essenciais e fragilidades tecnológicas, tornando-se complementares ao ecossistema da Nvidia em vez de substitutas. Essas oportunidades principais concentram-se em três direções:
A interconexão do poder computacional: O principal gargalo dos futuros clusters de poder computacional para IA mudou da capacidade de processamento de um único chip para a interconexão e transmissão de dados entre chips. Interconexões de alta velocidade de última geração, switches ópticos e chips de interconexão óptica são atualmente áreas não essenciais para a NVIDIA, mas podem gerar uma boa sinergia estratégica com os negócios principais da empresa.
Trilha de otimização heterogênea em nível de sistema: O data center de IA do futuro será um sistema heterogêneo que integra múltiplas arquiteturas, como GPU, LPU, CPU e comutador óptico. Há muitas necessidades de integração, simulação e otimização nesse contexto, e fabricantes de chips como NVIDIA e AMD não conseguem cobrir toda a cadeia de serviços de otimização neutra. Essa é a principal oportunidade para startups.
Estratégia de chips personalizados para setores verticais: Em cenários verticais como robótica, direção autônoma e IA industrial, a otimização personalizada da arquitetura de chips é essencial para cada aplicação. Esses subsetores não são o foco principal da NVIDIA, mas startups podem obter uma vantagem competitiva diferenciada ao aproveitar seu profundo conhecimento desses cenários.
6.3 A reestruturação dos modelos de negócios na era dos agentes e o impacto do AaaS no SaaSNesta conferência GTC, Jensen Huang propôs o novo modelo de negócios AaaS (Agente como Serviço), que desafia diretamente o modelo SaaS, dominante no mercado de software empresarial há mais de 20 anos, marcando uma mudança fundamental no modelo de negócios de serviços empresariais na era da IA.
A essência do modelo tradicional de SaaS é fornecer serviços de software padronizados para empresas. Independentemente do setor ou porte, as empresas utilizam os mesmos produtos padronizados. No entanto, a maturidade da tecnologia de Agentes possibilita serviços empresariais altamente customizados e personalizados. No futuro, o investimento principal das empresas migrará do "orçamento para aquisição de software de TI" para o "orçamento para aquisição de força de trabalho de IA". As empresas tradicionais de SaaS vendem software padronizado, enquanto os futuros provedores de serviços de Agentes oferecem uma força de trabalho de IA customizável e iterativa, capaz de atender a múltiplas necessidades funcionais, como RH, finanças, jurídico e operações. Seu tamanho de mercado é muito maior do que o do SaaS tradicional.
Essa transformação levará à polarização do setor: os fornecedores tradicionais de SaaS que não possuem recursos de modelagem de IA e não conseguem integrar a experiência do setor com a tecnologia de agentes correrão o risco de serem substituídos; enquanto os fornecedores que conseguirem concluir rapidamente a transformação para IA e combinar um profundo conhecimento do setor com a tecnologia de agentes e a otimização do poder computacional ganharão uma fatia maior do mercado.
6.4 A computação de borda e as implantações privadas tornaram-se novas arenas competitivas.Atualmente, os principais pontos fortes da Nvidia estão concentrados no mercado de poder computacional para data centers em nuvem, enquanto a IA de ponta e a implantação privada estão se tornando novas direções de crescimento e áreas competitivas no setor, além de potenciais desafios para a Nvidia.
Aplicações de IA de nível empresarial em setores tradicionais, limitadas por regulamentações e privacidade de dados, tendem a priorizar implantações privadas e computação de borda. Qualcomm, AMD, Broadcom e outros fabricantes estão investindo no mercado de IA de borda, lançando NPUs e chips de IA otimizados para computação de borda. Atualmente, nenhum player estabeleceu uma posição dominante nesse mercado, mas, uma vez que ele entre em um período de rápido crescimento, um novo cenário competitivo surgirá.
Na conferência GTC deste ano, a NVIDIA também lançou rapidamente seus produtos GGX Small Box e workstations de IA para implantações em edge computing e ambientes privados, acelerando sua expansão nesse setor. É previsível que, nos próximos 3 a 5 anos, a IA em edge computing e as implantações privadas se tornem as principais áreas competitivas no mercado de poder computacional para IA, e fatores-chave que influenciarão o cenário da indústria.
VII. Aviso de RiscoRisco de implementação de aplicações de IA aquém das expectativas: O principal suporte para a meta de encomendas de um trilhão de dólares da NVIDIA é a implementação em larga escala de agentes e aplicações de IA. Se a penetração de aplicações de IA no mercado for mais lenta do que o esperado, isso levará a uma desaceleração no crescimento da demanda por poder computacional, afetando o cumprimento dos prazos de entrega.
Risco de expansão da capacidade da cadeia de suprimentos ficar aquém das expectativas: A expansão da capacidade de processos avançados e embalagens da TSMC, da capacidade de memória HBM e da infraestrutura de data centers está sujeita a ciclos rígidos e incertezas. Se a expansão da capacidade da cadeia de suprimentos for mais lenta do que o esperado, isso limitará diretamente os embarques de chips e o cumprimento de pedidos da Nvidia.
Risco de intensificação da concorrência no setor: Google, AMD, os principais provedores de nuvem e os fabricantes de modelos em larga escala estão avançando com seus próprios chips de IA. Se os produtos dos concorrentes alcançarem avanços tecnológicos, isso reduzirá a participação de mercado da Nvidia e levará a uma deterioração do cenário competitivo do setor.
Risco de iteração tecnológica mais lenta do que o esperado: Se houver uma mudança disruptiva na arquitetura de modelos de grande porte ou um ajuste significativo no roteiro tecnológico dos chips de IA, as vantagens tecnológicas e de produto existentes da NVIDIA serão enfraquecidas e sua competitividade central será afetada.
Riscos da política regulatória global: O aperto contínuo dos controles de exportação e das regulamentações antitruste sobre chips de IA e a indústria de semicondutores pelas principais economias globais pode afetar negativamente as vendas globais e a pesquisa e desenvolvimento tecnológico da Nvidia;
Risco de volatilidade macroeconômica: A volatilidade macroeconômica global levará a uma contração nos investimentos de capital por parte de empresas e fornecedores de nuvem, uma diminuição na demanda por poder computacional de IA e um impacto adverso no volume de pedidos da Nvidia.
VIII. Análise das Perspectivas da Indústria e das Tendências Futuras8.1 Tendência de curto prazo (1-2 anos)A oferta restrita de poder computacional continuará: os gargalos de capacidade na cadeia de suprimentos de semicondutores e na infraestrutura de data centers dificilmente diminuirão no curto prazo, e a oferta restrita de poder computacional para IA persistirá até 2026, com os preços dos chips e do poder computacional permanecendo elevados.
A proporção da demanda por inferência continua a aumentar: os custos de inferência subirão rapidamente para mais de 70% do custo total da capacidade computacional de IA, e os chips de inferência de baixa latência e as soluções de otimização de inferência se tornarão o foco da pesquisa e desenvolvimento e dos investimentos do setor;
O modelo de múltiplas fundições da Nvidia foi oficialmente estabelecido: a Nvidia passará gradualmente de ser fornecedora exclusiva da TSMC para um modelo com múltiplas fundições, tendo a TSMC como fornecedora principal e a Samsung e a Intel como fornecedoras secundárias, a fim de aliviar gargalos de capacidade e garantir a entrega dos pedidos.
Os aplicativos de agentes estão entrando em uma fase de implantação em larga escala: os produtos de agentes para o cliente (C-end) alcançarão ampla cobertura de usuários, e a implantação de agentes em nível empresarial avançará rapidamente, tornando-se a principal força motriz para o crescimento da demanda por tokens.
8.2 Tendências de médio a longo prazo (3 a 5 anos)A computação heterogênea está se tornando a tendência dominante na indústria: os futuros sistemas de computação de IA formarão uma arquitetura híbrida heterogênea de "GPU + LPU + CPU + interconexão óptica". Diferentes arquiteturas de chips são adaptadas a diferentes cenários de aplicação, e um padrão diversificado de computação está sendo oficialmente estabelecido.
O ecossistema da Nvidia continua a expandir-se e sua posição de liderança permanece sólida: a Nvidia continuará a fortalecer sua posição como operadora de infraestrutura de IA e seu ecossistema completo continua a se expandir. Mesmo que sua participação de mercado diminua, sua posição de liderança no setor permanecerá inabalável.
O modelo AaaS está gradualmente substituindo o SaaS tradicional: AaaS (Agente como Serviço) se tornará o modelo de negócios predominante para serviços corporativos, e o mercado de serviços corporativos passará por uma reestruturação completa. Fornecedores com experiência no setor e capacidade de otimização de poder computacional se tornarão os principais participantes do mercado.
A IA de borda está se tornando um novo destaque de crescimento: o mercado de IA de borda e implantação privada entrará em um período de crescimento explosivo, tornando-se uma nova direção de crescimento para a indústria de poder computacional de IA e um eixo central para a competição do setor;
O cenário da cadeia de suprimentos de semicondutores está sendo remodelado: os fabricantes globais de semicondutores continuarão a expandir sua capacidade de processamento e embalagem avançados, e uma cadeia de suprimentos diversificada está gradualmente se consolidando, reduzindo a dependência de um único fabricante ou região.