Data raportu: kwiecień 2026$
Zakres badań: Kluczowe wydania podczas konferencji GTC NVIDII w 2026 roku, struktura popytu i podaży w branży mocy obliczeniowej AI, łańcuch dostaw półprzewodników, rywalizacja w chipach AI, zmiany w modelach biznesowych przemysłu AI.
Kluczowe oświadczenie: Ten raport jest jedynie badaniem i analizą branży, nie stanowi żadnej porady inwestycyjnej.
Streszczenie
Na konferencji GTC NVIDII w 2026 roku, założyciel firmy Jensen Huang przedstawił kluczowy cel: do końca 2027 roku wartość zamówień na platformy Blackwell i Vera Rubin ma przekroczyć 1 bilion dolarów. Cel ten przyciągnął szeroką uwagę na całym świecie w branży technologicznej i półprzewodnikowej. Raport ten łączy doświadczenia inwestorów w branży AI, byłego kluczowego lidera badań i rozwoju NVIDII, czołowych architektów chipów oraz operatorów chmurowych GPU, aby szczegółowo rozłożyć logikę wsparcia tego bilionowego celu, kluczowe wąskie gardła w procesie jego realizacji, ewolucję kluczowego muru obronnego firmy oraz jego rewolucyjny wpływ na globalny krajobraz branży mocy obliczeniowej AI, łańcuch dostaw półprzewodników i modele biznesowe usług dla przedsiębiorstw.
Badania pokazują, że cel Nvidii, wart bilion dolarów, jest fundamentalnie wspierany przez zmianę struktury kosztów mocy obliczeniowej AI z „opartej na szkoleniu” na „opartą na wnioskowaniu” oraz gwałtowny wzrost popytu na tokeny, napędzany eksplozją inteligencji agentów. Główne ograniczenie w osiągnięciu tego celu przesunęło się z możliwości projektowania układów scalonych na fizyczne wąskie gardła, takie jak moce produkcyjne całego łańcucha dostaw półprzewodników i infrastruktura zasilania centrów danych. W perspektywie krótkoterminowej wiodąca pozycja Nvidii w zakresie mocy obliczeniowej AI prawdopodobnie nie zostanie zachwiana, a jej ekosystem pełnego stosu i kontrola łańcucha dostaw pozostają jej podstawowymi przewagami konkurencyjnymi. W perspektywie średnio- i długoterminowej globalny rynek mocy obliczeniowej będzie stopniowo kształtował zróżnicowany i heterogeniczny krajobraz, w którym brzegowa AI i wdrażanie agentów na poziomie korporacyjnym staną się nowymi kierunkami wzrostu i kluczowymi ścieżkami konkurencyjności dla branży.
I. Wnioski główne
Cel wart bilion dolarów ma wyraźne poparcie popytu, a tempo jego wdrożenia zależy od stopnia penetracji rynku agentów: zamówienia Nvidii o wartości biliona dolarów to nie tylko oczekiwania sprzedażowe, ale kluczowy krok w strategicznej transformacji firmy z producenta GPU w operatora infrastruktury AI. Zapotrzebowanie na inferencję stało się głównym motorem długoterminowego wzrostu mocy obliczeniowej AI. Szacuje się, że w ciągu najbliższych 1-2 lat koszty inferencji będą stanowić 70-80% całkowitych kosztów mocy obliczeniowej. Wdrożenie inteligentnych agentów Agent na dużą skalę doprowadzi do szybkiego wzrostu popytu na tokeny, zapewniając gwarancję popytu na cel wart bilion dolarów.
Wąskie gardła w całym łańcuchu dostaw stanowią główną przeszkodę w osiągnięciu celu biliona dolarów: rozwój mocy produkcyjnych w branży półprzewodników ma sztywny cykl, a proces technologiczny 3 nm firmy TSMC, zaawansowane możliwości pakowania CoWoS, dostawy pamięci o dużej przepustowości HBM oraz możliwości dystrybucji zasilania i infrastruktury centrów danych to cztery główne wąskie gardła ograniczające wykorzystanie mocy obliczeniowej. Oczekuje się, że niedobór komponentów pomocniczych w całym łańcuchu dostaw utrzyma się do końca 2027 roku, co bezpośrednio wpłynie na harmonogram realizacji zamówień firmy Nvidia i osiągnięcie celu.
Główna przewaga konkurencyjna firmy NVIDIA została wzmocniona, a pojedynczy przełom technologiczny raczej nie zachwieje jej wiodącej pozycji: podstawowa bariera konkurencyjna firmy została podniesiona z pojedynczego ekosystemu oprogramowania CUDA do kompleksowej przewagi w postaci „możliwości projektowania układów scalonych opartych na sztucznej inteligencji + ekosystemu pełnego stosu oprogramowania i sprzętu + absolutnej kontroli nad łańcuchem dostaw + ekosystemu deweloperskiego”. Chociaż Coding Agent obniża próg optymalizacji jądra CUDA, nie jest w stanie odtworzyć jego możliwości optymalizacji na poziomie całego stosu systemowego i spójności ekosystemu.
Globalny rynek mocy obliczeniowej stanie się bardziej zróżnicowany i heterogeniczny, ograniczając możliwości startupów w sektorze układów wnioskowania ogólnego przeznaczenia: Przyszłe systemy obliczeniowe AI będą tworzyć heterogeniczną architekturę hybrydową „GPU + LPU + CPU + połączenie optyczne”. TPU firmy Google, seria MI firmy AMD oraz samodzielnie opracowane układy scalone dostawców usług chmurowych będą zajmować pewien udział w rynku w określonych scenariuszach, łagodząc absolutny monopol firmy Nvidia. Jednak możliwości startupów w sektorze układów wnioskowania ogólnego przeznaczenia są zasadniczo ograniczone. Kluczowa szansa rozwoju dla startupów leży w uzupełnianiu ekosystemu Nvidia i współpracy innowacyjnej w określonych podsektorach.
AaaS (Ameryka jako Usługa) zmieni model biznesowy usług korporacyjnych, stawiając tradycyjne rozwiązania SaaS pod presją transformacji: Dojrzałość technologii agentów doprowadzi do przejścia usług korporacyjnych ze standardowego modelu SaaS na wysoce spersonalizowany model Agent jako Usługa (AaaS). Główne inwestycje przedsiębiorstw przesuną się z zakupów oprogramowania IT na zakup siły roboczej w obszarze AI. Dostawcy z doświadczeniem w branży i możliwościami optymalizacji mocy obliczeniowej zyskają nowe możliwości rozwoju, podczas gdy tradycyjni dostawcy SaaS, którzy nie posiadają możliwości modelu AI, będą narażeni na ryzyko zastąpienia.
II. Podłoże badawcze
Konferencja NVIDIA GTC, która odbędzie się w marcu 2026 roku, wyznacza trendy w globalnej branży sztucznej inteligencji i półprzewodników. Podczas konferencji Jensen Huang zaproponował główny cel, który wpłynie na branżę: do końca 2027 roku skumulowana wartość zamówień na platformy Blackwell i Vera Rubin wyniesie nie mniej niż 1 bilion dolarów.
Nie można zignorować wpływu tego celu na branżę: w 2024 roku roczna sprzedaż globalnego przemysłu półprzewodników wyniosła zaledwie ponad 600 miliardów dolarów. Nvidia planuje przewyższyć roczną sprzedaż globalnego przemysłu półprzewodników w ciągu trzech lat, wykorzystując swoją jedyną firmę i dwie główne platformy produktowe. U podstaw tego celu leży zasadnicza sprzeczność w obecnej branży sztucznej inteligencji: popyt na moc obliczeniową rośnie eksplozywnie, sięgając bilionów dolarów, podczas gdy strona podażowa zmaga się z wąskimi gardłami w całym łańcuchu dostaw, od zaawansowanych możliwości produkcji płytek półprzewodnikowych i procesów pakowania, po układy pamięci i dystrybucję zasilania.
W tym samym czasie, na konferencji GTC, firma NVIDIA zakończyła największą w swojej historii jednoczesną premierę produktu: platforma Vera Rubin została jednocześnie wyposażona w 7 nowych masowo produkowanych układów scalonych o wydajności wnioskowania 10-krotnie wyższej niż platforma Blackwell i koszcie pojedynczego tokena obniżonym do 1/10 pierwotnej wartości; zaledwie 4 miesiące po sfinalizowaniu przejęcia firmy Grok, firma oficjalnie wypuściła układ wnioskowania LPU, w pełni wdrażając go w ramach ścieżki wnioskowania o niskich opóźnieniach; jednocześnie uruchomiła ekosystem oprogramowania Nemo Cloud, koncentrując się na podstawowym punkcie wejścia do wdrażania agentów na poziomie przedsiębiorstwa, uzupełniając układ pełnego stosu od sprzętu po oprogramowanie, od szkolenia po wnioskowanie oraz od układów po infrastrukturę centrum danych.
W raporcie tym przeprowadzono dogłębną analizę wykonalności, wpływu na branżę i transformacji branży celu firmy Nvidia o wartości biliona dolarów, dostarczając kompleksowych i obiektywnych informacji branżowych dla uczestników branży i inwestorów.
III. Podstawowa logika stojąca za celem Nvidii w zakresie zamówień o wartości biliona dolarów
3.1 Podstawowa restrukturyzacja pozycjonowania strategicznego: od producenta GPU do operatora infrastruktury AI
Bilionowy cel Jensena Huanga nie polega wyłącznie na zwiększeniu sprzedaży układów scalonych; jego sednem jest całkowita reorganizacja działalności firmy Nvidia — przekształcenie się z największej na świecie firmy projektującej układy GPU w operatora infrastruktury ery sztucznej inteligencji, tworząc fabrykę mocy obliczeniowej AI obejmującą całą branżę.
Zhang Lu, założyciel i partner zarządzający Fusion Fund, stwierdził, że podstawowym produktem komercyjnym Nvidii nie jest już sprzęt GPU, lecz podstawowa produktywność ery AI – token. Ta zmiana pozycjonowania pozwala Nvidii przełamać ograniczenia rynkowe tradycyjnych układów scalonych i precyzyjnie dopasować się do długoterminowych możliwości wzrostu, jakie niesie ze sobą transformacja AI w całej cyfrowej gospodarce.
Z perspektywy modelu biznesowego, NVIDIA przeszła od „sprzedaży produktów sprzętowych” do „dostarczania kompleksowych rozwiązań infrastruktury obliczeniowej”. Podczas tegorocznej konferencji GTC, NVIDIA nie tylko zaprezentowała produkty w postaci chipów, ale także prefabrykowane, modułowe rozwiązanie dla centrów danych AI, skracając cykl budowy centrów danych z 18-20 do 6-9 miesięcy. W istocie, zapewnia to klientom „gotową do użycia” fabrykę mocy obliczeniowej AI, realizując modernizację modelu biznesowego ze sprzedaży pojedynczych chipów do świadczenia kompleksowych usług infrastrukturalnych w całym cyklu życia, a także zapewniając solidne wsparcie logiki biznesowej dla swojego celu, jakim jest osiągnięcie biliona dolarów zamówień.
3.2 Odwrócenie struktury kosztów obliczeniowych: popyt na wnioskowanie staje się głównym motorem długoterminowego wzrostu
Podstawową logiką popytu, która uzasadnia cel biliona juanów, jest fundamentalna zmiana w strukturze kosztów mocy obliczeniowej AI: koszty mocy obliczeniowej w branży gwałtownie zmieniły się z „opartych na szkoleniu” na „opartych na wnioskowaniu”, a popyt na wnioskowanie stanie się długoterminowym, stabilnym i masowym źródłem przepływu gotówki dla mocy obliczeniowej AI.
Na wczesnych etapach rozwoju branży AI, koszty mocy obliczeniowej w branży koncentrowały się głównie na etapie wstępnego trenowania dużych modeli. W 2023 roku 70–80% kosztów mocy obliczeniowej układów scalonych w branży było inwestowane w trenowanie modeli. Szkolenie jest jednorazową inwestycją w aktywa trwałe, a popyt koncentruje się u kilku dużych producentów modeli, więc potencjał wzrostu jest stosunkowo ograniczony.
Wraz z rozwojem technologii dużych modeli, udział kosztów wnioskowania gwałtownie rośnie: obecnie koszty szkolenia i wnioskowania wiodących dostawców dużych modeli są zasadniczo równe; szacuje się, że w latach 2025–2026 koszty wnioskowania będą stanowić 70–80% całkowitych kosztów mocy obliczeniowej sztucznej inteligencji, stając się największym wydatkiem budżetowym branży.
Dane ujawnione przez Jensena Huanga na konferencji również potwierdzają ten trend: w ciągu ostatnich dwóch lat wolumen obliczeń inferencyjnych wzrósł 10 000-krotnie, użycie tokenów wzrosło 100-krotnie, a ogólne zapotrzebowanie na moc obliczeniową wzrosło milion razy, a ta dynamika wzrostu nadal się utrzymuje. W przeciwieństwie do jednorazowej inwestycji w szkolenia, zapotrzebowanie na inferencyjne rozwiązania jest ciągłe i charakteryzuje się wysoką częstotliwością, a wraz z upowszechnianiem się aplikacji AI stale rośnie, zapewniając długoterminowe i stabilne wsparcie popytu na realizację celu firmy NVIDIA, jakim jest bilion dolarów zamówień.
3.3 Rozwój inteligentnych agentów bazujących na agentach powoduje wykładniczy wzrost popytu na tokeny.
Wzrost zapotrzebowania na wnioskowanie jest napędzany przede wszystkim przez masowe wdrażanie inteligentnych agentów Agent. W przeciwieństwie do tradycyjnych, pojedynczych wywołań dużego modelu, inteligentni agenci Agent wymagają ciągłej pracy online, reakcji w czasie rzeczywistym i interakcji wielorundowych, co stawia wyższe wymagania dotyczące niskich opóźnień, długiego przetwarzania kontekstowego i możliwości jednoczesnego generowania tokenów dla pojedynczego użytkownika, co bezpośrednio prowadzi do znacznego wzrostu zużycia tokenów.
Podczas tegorocznej konferencji GTC, „Otwarta Chmura” była jednym z najczęściej wymienianych przez Huanga Renxuna słów kluczowych, a jej głównym celem było dostosowanie się do wdrażania inteligentnych agentów na dużą skalę. Wielu ekspertów branżowych uważa, że agenci staną się głównym nośnikiem kolejnej generacji usług korporacyjnych i internetu konsumenckiego, po komputerach stacjonarnych i internecie mobilnym, a ich zapotrzebowanie na moc obliczeniową znacznie przewyższy zapotrzebowanie tradycyjnych aplikacji internetowych.
Pod względem szybkości wdrażania, wskaźnik penetracji aplikacji agentów na rynku chińskim przewyższył wskaźnik w Stanach Zjednoczonych. Produkty agentów, reprezentowane przez Doubao firmy ByteDance, zyskały dużą popularność wśród użytkowników końcowych. Podczas gdy rynek amerykański koncentruje się obecnie na kodowaniu sztucznej inteligencji na poziomie korporacyjnym i rozwoju modeli multimodalnych, wdrażanie agentów na poziomie korporacyjnym szybko postępuje. Wraz z dojrzewaniem technologii agentów, popyt na tokeny stanie się głównym motorem wzrostu dla celu Nvidii, jakim jest osiągnięcie biliona dolarów zamówień.
IV. Główne wąskie gardła i ograniczenia łańcucha dostaw w osiągnięciu celu biliona juanów
Realizacja zamówień wartych biliony dolarów musi najpierw pokonać fizyczne ograniczenia branży półprzewodników i infrastruktury. Wielu ekspertów branżowych uważa, że głównym wąskim gardłem, które obecnie utrudnia firmie Nvidia osiągnięcie celu biliona dolarów, nie są już możliwości projektowania układów scalonych, lecz ograniczenia pojemności całego łańcucha dostaw półprzewodników oraz sztywne ograniczenia infrastruktury centrów danych.
4.1 Podstawowe ograniczenia wydajności zaawansowanych procesów i pakowania
W procesie produkcji płytek, proces 3 nm firmy TSMC stanowi podstawę platform Blackwell i Vera Rubin firmy Nvidia, a moce produkcyjne TSMC bezpośrednio determinują górny limit dostaw układów scalonych przez firmę Nvidia. W porównaniu z wydajnością płytek 3 nm, bardziej widocznym wąskim gardłem jest zaawansowana wydajność pakowania CoWoS.
Zaawansowane pakowanie CoWoS to kluczowy proces osiągania wysokiej przepustowości i wydajności w układach AI, a jednocześnie poważny problem w obecnej branży mocy obliczeniowej AI. Od 2024 roku TSMC potroiło swoje możliwości w zakresie CoWoS i nadal je rozwija, ale wciąż nie jest w stanie sprostać gwałtownemu wzrostowi popytu ze strony branży.
Wykorzystując głęboką, trwającą ponad dwie dekady współpracę z TSMC, Nvidia zapewniła sobie znaczną część mocy produkcyjnych TSMC w zakresie rozwiązań CoWoS. Stanowi to zarówno kluczową przewagę w łańcuchu dostaw, jak i poważne ograniczenie w rozbudowie mocy produkcyjnych. Nawet przy zamówieniach o wartości bilionów dolarów, rozbudowa mocy produkcyjnych TSMC w zakresie zaawansowanych rozwiązań pakujących ma sztywny cykl, co uniemożliwia szybki wzrost w perspektywie krótkoterminowej i bezpośrednio ogranicza wolumen dostaw układów scalonych Nvidii.
4.2 Ograniczone dostawy w całym łańcuchu dostaw układów pamięci
Wydajność układów AI w dużym stopniu opiera się na pamięci o dużej przepustowości (HBM), co czyni ją niezbędną w branży mocy obliczeniowej AI. Mniej więcej w czasie konferencji GTC, Micron i Samsung ogłosiły oficjalną masową produkcję pamięci HBM4. Tymczasem trzej czołowi producenci – Micron, Samsung i SK Hynix – opracowują rozwiązania dostosowane do potrzeb platformy nowej generacji firmy NVIDIA.
Jednak ekspansja mocy produkcyjnych HBM napotyka na poważne ograniczenia procesowe, a niskie moce produkcyjne HBM wywołały reakcję łańcuchową niedoborów w całej branży układów pamięci: moce produkcyjne pamięci DDR i układów pamięci SSD zostały ograniczone przez HBM, a ceny układów pamięci w branży stale rosły, a ceny produktów pokrewnych wzrosły o 100–200% w ciągu ostatniego roku. Według informacji z pierwszej ręki z łańcucha dostaw, niedobór układów pamięci ma się utrzymywać do końca 2027 roku, stając się jednym z głównych wąskich gardeł ograniczających wykorzystanie mocy obliczeniowej.
4.3 Sztywne sufity w infrastrukturze centrum danych i zasilaniu
Zamówienia Nvidii o wartości bilionów dolarów muszą ostatecznie zostać zrealizowane w rzeczywistych centrach danych. Obecnie największym wąskim gardłem ograniczającym wykorzystanie mocy obliczeniowej nie są już same układy scalone, ale możliwości infrastruktury centrów danych, a zwłaszcza zasilanie.
Alex, założyciel GMI Cloud, wiodącego globalnego dostawcy usług w chmurze opartych na GPU, stwierdził, że największym ograniczeniem dla osiągnięcia biliona dolarów przychodów jest szybkość budowy centrów danych, a głównym wąskim gardłem w tym procesie jest energia elektryczna. Obecnie amerykańska publiczna sieć energetyczna nie dysponuje mocą przemysłową przekraczającą 10 megawatów. 90% nowo budowanych centrów danych stosuje model Behind-the-Meter – omijając publiczną sieć energetyczną i budując lokalne generatory gazu ziemnego, aby osiągnąć samowystarczalność energetyczną. Niektórzy czołowi dostawcy usług w chmurze bezpośrednio założyli elektrownie jądrowe, aby zapewnić dedykowane zasilanie dla swoich centrów danych.
Stany Zjednoczone nie mają problemów z brakiem mocy wytwórczych; głównym wąskim gardłem jest dystrybucja energii. Budowa podstacji dla publicznej sieci elektroenergetycznej i dystrybucja energii elektrycznej wysokiego napięcia podlegają surowym ograniczeniom regulacyjnym, z długimi cyklami zatwierdzania i powolnym tempem wdrażania, co nie nadąża za tempem budowy centrów danych AI. To sztywne ograniczenie bezpośrednio determinuje górny limit globalnej rozbudowy infrastruktury mocy obliczeniowej i pośrednio wpływa na postępy w realizacji zamówień Nvidii o wartości bilionów dolarów.
4.4 Ryzyko niedoboru komponentów pomocniczych w całym łańcuchu przemysłowym
Oprócz rdzeniowych układów scalonych, pamięci masowej i zasilania, cały łańcuch infrastruktury obliczeniowej AI zmaga się z niedoborami dostaw. Dane operacyjne z pierwszej ręki pokazują, że obecny niedobór rozprzestrzenił się z rdzeniowych układów scalonych na cały łańcuch branżowy: brakuje podstawowych komponentów, takich jak przełączniki CX7 firmy NVIDIA BlueField, serwerowe procesory Intel, chłodzone cieczą rozwiązania CDU dla centrów danych oraz moduły optyczne, a cykle dostaw stale się wydłużają.
Serwer AI wysokiej klasy składa się z ponad 200 000 pojedynczych komponentów. Niedobór któregokolwiek z nich wpłynie na finalną dostawę serwera i wdrożenie mocy obliczeniowej. Oznacza to, że bilionowy cel firmy Nvidia nie może zostać osiągnięty samodzielnie. Wymaga to jednoczesnej rozbudowy całego łańcucha branżowego półprzewodników, elektroniki i centrów danych, a skoordynowana ekspansja całego łańcucha branżowego jest obarczona znaczną niepewnością.
V. Główne przewagi konkurencyjne firmy NVIDIA i możliwości iteracji technologicznej
W obliczu konkurencji w całej branży i ograniczeń w łańcuchu dostaw, zdolność Nvidii do osiągnięcia celu w postaci zamówień o wartości biliona dolarów opiera się na stale wzmacnianych barierach technologicznych i przewadze ekosystemu full-stack. Podczas tej konferencji GTC, kluczowe przewagi konkurencyjne Nvidii zostały w pełni udoskonalone, tworząc wielowymiarową przewagę konkurencyjną.
5.1 Rewolucja w projektowaniu układów scalonych oparta na sztucznej inteligencji, znacznie przyspieszająca szybkość iteracji
Podczas tegorocznej konferencji GTC firma NVIDIA zaprezentowała siedem nowych, produkowanych masowo układów scalonych dla platformy Vera Rubin. Było to największe jednoczesne wprowadzenie na rynek produktu w historii firmy i przełamanie tradycyjnego rytmu iteracji produktów w branży półprzewodników.
Kilka lat temu standardowym tempem w branży półprzewodników było tworzenie kolejnych iteracji flagowego układu co dwa lata, a czołowi producenci byli uważani za liderów branży, jeśli mogli wprowadzać na rynek jeden lub dwa nowe układy rocznie. Zdolność firmy Nvidia do jednoczesnego opracowywania i masowej produkcji wielu układów rocznie wynika przede wszystkim z głębokiej integracji sztucznej inteligencji z całym procesem projektowania układów.
Dr Mark Ren, były dyrektor ds. badań w firmie NVIDIA oraz założyciel i prezes firmy Agentris, ujawnił, że NVIDIA w pełni wdrożyła Coding Agent wewnętrznie, znacząco poprawiając wydajność pracy inżynierów zajmujących się projektowaniem układów scalonych. W 2023 roku NVIDIA uruchomiła projekt Chip Nemo – w oparciu o ponad 20 miliardów tokenów wewnętrznych danych związanych z projektowaniem układów scalonych, wytrenowano dedykowany, rozbudowany model obejmujący cały proces projektowania układów scalonych, od interpretacji wymagań projektowych i generowania kodu sprzętowego RTL, po optymalizację wydajności układu scalonego i dostrajanie zużycia energii. Sztuczna inteligencja została głęboko zintegrowana z każdym aspektem projektowania układów scalonych.
Tradycyjne modele uczenia maszynowego mogą rozwiązywać jedynie lokalne problemy w projektowaniu układów scalonych, podczas gdy dojrzałość modeli języka programowania i technologii agentów pozwoliła na pełne wykorzystanie możliwości projektowania układów scalonych. Jest to również kluczowa zdolność, która pozwala firmie NVIDIA na szybkie rozwijanie jednoczesnego rozwoju wielu układów scalonych i ciągłe skracanie cyklu iteracji, tworząc przewagę badawczo-rozwojową, trudną do powtórzenia przez innych producentów.
5.2 Innowacje architektoniczne rozwiązują problemy związane z wnioskowaniem, LPU blokuje nową generację mocy obliczeniowej.
Na tegorocznej konferencji GTC, zaledwie cztery miesiące po przejęciu Groka, NVIDIA oficjalnie zaprezentowała swój układ wnioskowania LPU oparty na technologii Groka. Jensen Huang zasugerował nawet, że „wszystkie centra danych powinny zarezerwować 25% swojej powierzchni na układy wnioskowania reprezentowane przez Groka”. Ten krok oznacza, że NVIDIA całkowicie wypełniła lukę w dziedzinie wnioskowania o niskich opóźnieniach i zapewniła sobie kluczową przewagę w architekturze obliczeniowej nowej generacji.
Dr Xiao Zhibin, były architekt układu Hanguang 800 firmy Alibaba, przeanalizował podstawowe zalety architektoniczne Grok LPU: Tradycyjne układy AI zazwyczaj wykorzystują architekturę DRAM, polegającą na zewnętrznej pamięci o dużej pojemności do przechowywania wag modeli, co nie tylko wiąże się z dużym opóźnieniem dostępu, ale również wymaga dynamicznego odświeżania; podczas gdy Grok LPU wykorzystuje architekturę SRAM na chipie, eliminując DRAM i przechowując wagi modeli oraz pamięć podręczną KV w pamięci SRAM na chipie, z opóźnieniem dostępu wynoszącym zaledwie 1-2 nanosekundy. Pozwala to na rozbudowę klastra dzięki wydajnym połączeniom na chipie, które dobrze dostosowują się do wymagań aplikacji agentowych w zakresie niskich opóźnień.
Zgodnie z logiką wnioskowania dużych modeli, składa się on z dwóch etapów: kodera i dekodera. Koder nadaje się do wysokoprzepustowego przetwarzania wsadowego na procesorach GPU, natomiast dekoder to szeregowy proces generowania tokenów. Każda generacja tokenów wymaga wielokrotnego odczytywania wag modelu, przy czym większość czasu poświęcana jest na komunikację wag, a nie na obliczenia. Jednostka obliczeniowa Grok LPU umieszcza wszystkie wagi na chipie, całkowicie eliminując narzut komunikacyjny. W scenariuszach generowania tokenów dla pojedynczego użytkownika jego wydajność jest ponad 30 razy wyższa niż GPU.
Wielu ekspertów branżowych uważa, że przyszłe systemy obliczeniowe AI będą nieuchronnie opierać się na heterogenicznych architekturach hybrydowych – procesorach graficznych (GPU) do przetwarzania wsadowego enkoderów i jednostkach LPU do generowania dekoderów z niskim opóźnieniem, przy czym różne architektury układów scalonych dostosowują się do różnych operatorów i scenariuszy. Nvidia, poprzez przejęcie Grok, zapewniła sobie kluczową przewagę w dziedzinie architektur inferencyjnych nowej generacji, umacniając swoją wiodącą pozycję na rynku mocy obliczeniowej dla wszystkich scenariuszy.
5.3 Ewolucja barier ekosystemu CUDA: trudność replikacji ekosystemu pełnego stosu
Podstawową przewagą firmy NVIDIA w ciągu ostatnich dwóch dekad był jej ekosystem oprogramowania skoncentrowany na CUDA. Wraz z szybkim rozwojem agentów kodowania, w branży zaczęto dostrzegać zmianę w poglądzie, że „bariery wejścia na rynek CUDA słabną”. W raporcie stwierdzono, że chociaż agenci kodowania rzeczywiście obniżyli barierę wejścia w zakresie optymalizacji jądra CUDA, przewaga konkurencyjna firmy NVIDIA ewoluowała od pojedynczej warstwy oprogramowania CUDA do ekosystemu infrastruktury AI pełnego stosu – przewagi, którą wciąż trudno powtórzyć.
Z technicznego punktu widzenia, kod CUDA generowany przez sztuczną inteligencję może już osiągnąć ponad 90% wydajności wymaganej do ręcznej optymalizacji, a próg optymalizacji na poziomie jądra rzeczywiście maleje. Jednak główna przewaga firmy NVIDIA leży w jej doświadczeniu w projektowaniu sprzętu, danych debugowania na poziomie systemu oraz możliwościach kompleksowej optymalizacji. Agent kodujący nie jest w stanie uzyskać tych danych i doświadczenia, ani nie może ich odtworzyć żaden inny producent.
Z perspektywy ekosystemu, przewaga CUDA leży nie tylko w samej technologii, ale także w największej na świecie społeczności programistów GPU, jaką udało się jej stworzyć. Dzięki programowi Inception Program, NVIDIA wsparła ponad 20 000 startupów od 2017 roku, tworząc silną społeczność programistów i wywierając wpływ na ekosystem. Nawet jeśli inni dostawcy powielą funkcjonalność CUDA, trudno im będzie zbudować tak rozległy ekosystem programistów w krótkim okresie.
Co ważniejsze, podczas tej konferencji GTC układ ekosystemu NVIDIA rozszerzył się z podstawowych narzędzi programistycznych na warstwę aplikacji agenta, wprowadzając ekosystem oprogramowania Nemo Cloud, osiągając pełną integrację z Open Cloud, koncentrując się na kluczowym punkcie wejścia do wdrażania agentów na poziomie korporacyjnym, walcząc o prawo do ustalania reguł branżowych w erze agentów oraz tworząc zamkniętą pętlę ekosystemu pełnego stosu, od narzędzi bazowych po aplikacje wyższej warstwy. Ta przewaga ekosystemu znacznie wykracza poza to, co może zachwiać samo skopiowanie CUDA.
5.4 Podstawowe zalety kontroli łańcucha dostaw
Kolejną kluczową zaletą firmy Nvidia jest jej absolutna kontrola nad łańcuchem dostaw półprzewodników. Dzięki największej na świecie skali zakupów układów AI i ponad 20-letniej, głębokiej współpracy z TSMC, Nvidia zapewniła sobie większość mocy produkcyjnych TSMC w zakresie procesu 3 nm i zaawansowanego pakowania CoWoS, co stanowi barierę, którą konkurenci, tacy jak AMD i Google, będą mieli trudności z pokonaniem w krótkim okresie.
Nawet jeśli firmy takie jak AMD i Google zdobędą zamówienia klientów, będą miały trudności z konkurowaniem z Nvidią w zakresie zaawansowanych procesów produkcyjnych i możliwości pakowania. Tymczasem Nvidia realizuje model wieloodlewniczy, wykorzystując głównie TSMC, wspierany przez Samsunga i Intela, aby jeszcze bardziej rozszerzyć swój łańcuch dostaw i zwiększyć stabilność. Ta długotrwała kontrola nad łańcuchem dostaw stanowi kluczowe wsparcie dla Nvidii w osiągnięciu celu w postaci biliona dolarów zamówień i stanowi kluczową przewagę, którą inni konkurenci mają trudności z powtórzeniem.
VI. Analiza konkurencji branżowej i możliwości rynkowych
6.1 Globalny rynek mocy obliczeniowej będzie stanowił zróżnicowany i heterogeniczny krajobraz, przy czym wiodąca pozycja firmy Nvidia pozostanie silna.
W raporcie autorzy twierdzą, że przyszły rynek mocy obliczeniowej AI nie utworzy absolutnego monopolu, w którym dominować będzie firma Nvidia, lecz raczej zróżnicowany i heterogeniczny krajobraz charakteryzujący się „wiodącą pozycją firmy Nvidia i wieloma dostawcami konkurującymi w zróżnicowanych scenariuszach”.
Z perspektywy konkurencji, technologia TPU firmy Google, wspierana przez własną optymalizację pełnego stosu, charakteryzuje się kosztem szkolenia wynoszącym zaledwie 1/3 kosztu ChatGPT i doskonałą wydajnością. Jednak ta przewaga ogranicza się do ekosystemu Google, a firmom zewnętrznym trudno jest osiągnąć takie same rezultaty optymalizacji. Układy AMD z serii MI stopniowo zdobywają rynek mocy obliczeniowej średniej i niskiej klasy i zdobyły już pewien udział w scenariuszach inferencyjnych. Wiodący dostawcy usług w chmurze i producenci dużych modeli, tacy jak OpenAI, Meta i Amazon, promują rozwój własnych układów i dostosowywanie ich do własnych scenariuszy, co będzie miało pewien wpływ na udział rynkowy firmy Nvidia.
Jednak w perspektywie krótkoterminowej wiodąca pozycja Nvidii pozostaje niezachwiana. Jej główną przewagą jest zdolność, jako zewnętrznego dostawcy usług, do oferowania kompleksowych rozwiązań optymalizacji na poziomie systemu dla klientów o zróżnicowanych potrzebach w różnych branżach – możliwości, których inni dostawcy koncentrujący się na własnych ekosystemach mają trudności z prześcignięciem. Co więcej, jej ekosystem pełnego stosu, efektywność prac badawczo-rozwojowych oraz kontrola łańcucha dostaw pozostają wiodące w branży.
6.2 Okno dla startupów zajmujących się układami wnioskowania ogólnego przeznaczenia jest w zasadzie zamknięte, ale w niszowych sektorach nadal istnieją możliwości.
Biorąc pod uwagę silną pozycję firmy Nvidia w dziedzinie wnioskowania, branża uważnie przygląda się temu, czy startupy zajmujące się układami AI mają jeszcze szansę na rozwój.
Wielu ekspertów branżowych uważa, że możliwości rozwoju przedsiębiorczości w sektorze uniwersalnych układów scalonych do wnioskowania w dużej mierze się wyczerpały, ale nadal istnieje duże pole do innowacji i współpracy w mniej priorytetowych podsektorach firmy NVIDIA oraz obszarach, w których firma wykazuje słabości.
Na rynku układów scalonych do wnioskowania ogólnego przeznaczenia, NVIDIA osiągnęła pełną optymalizację stosu infrastruktury AI i może pochwalić się silnymi wewnętrznymi możliwościami innowacyjnymi. W kluczowych obszarach działalności firmy, startupy mają trudności z konkurowaniem z nią zarówno pod względem inwestycji w zasoby, jak i efektywności iteracji. Jednocześnie, lojalność deweloperów wobec ekosystemu CUDA utrudnia również startupom uzyskanie akceptacji rynkowej dla układów ogólnego przeznaczenia.
Kluczowa szansa rozwoju dla startupów polega na unikaniu kluczowych obszarów działalności Nvidii i skupieniu się na obszarach, w których Nvidia ma obecnie priorytety i słabości technologiczne, stając się uzupełnieniem ekosystemu Nvidii, a nie jego zamiennikiem. Te kluczowe możliwości koncentrują się głównie w trzech kierunkach:
Ścieżka połączeń mocy obliczeniowej: Kluczowe wąskie gardło przyszłych klastrów mocy obliczeniowej AI przesunęło się z mocy obliczeniowej pojedynczego układu scalonego na połączenia i transmisję danych między układami. Szybkie połączenia nowej generacji, przełączniki optyczne i optyczne układy scalone są obecnie obszarami niebędącymi priorytetami firmy NVIDIA i mogą tworzyć dobrą strategiczną synergię z jej podstawową działalnością.
Heterogeniczna ścieżka optymalizacji na poziomie systemu: Centrum danych AI przyszłości będzie heterogenicznym systemem integrującym wiele architektur, takich jak GPU, LPU, CPU i przełącznik optyczny. Wiąże się to z wieloma potrzebami w zakresie integracji, symulacji i optymalizacji, a producenci układów scalonych, tacy jak NVIDIA i AMD, nie są w stanie obsłużyć całego łańcucha neutralnych usług optymalizacji. To kluczowa szansa dla startupów.
Dostosowana ścieżka rozwoju układów scalonych dla konkretnych branż: W branżach branżowych, takich jak robotyka, autonomiczne pojazdy i przemysłowa sztuczna inteligencja, optymalizacja architektury układów scalonych jest wymagana dla każdego scenariusza. Te podsektory nie stanowią głównego obszaru zainteresowania firmy NVIDIA, ale startupy mogą zyskać zróżnicowaną przewagę konkurencyjną, wykorzystując dogłębną wiedzę na temat tych scenariuszy.
6.3 Restrukturyzacja modeli biznesowych w erze agentów i wpływ AaaS na SaaS
Podczas konferencji GTC Jensen Huang zaproponował nowy model biznesowy AaaS (Agent as a Service), który stanowi bezpośrednie wyzwanie dla modelu SaaS, dominującego na rynku oprogramowania dla przedsiębiorstw od ponad 20 lat, co oznacza fundamentalną zmianę w modelu biznesowym usług dla przedsiębiorstw w erze sztucznej inteligencji.
Podstawą tradycyjnego modelu SaaS jest dostarczanie przedsiębiorstwom standardowych usług oprogramowania. Niezależnie od branży i wielkości, przedsiębiorstwa korzystają z tych samych, standardowych produktów. Jednak dojrzałość technologii Agent umożliwia wysoce spersonalizowane i dostosowane do potrzeb klienta usługi dla przedsiębiorstw. W przyszłości główne inwestycje przedsiębiorstw przesuną się z „budżetu na zakup oprogramowania IT” na „budżet na zakup kadry AI”. Tradycyjne firmy SaaS sprzedają standardowe oprogramowanie, podczas gdy przyszli dostawcy usług Agent oferują konfigurowalną i iteracyjną kadrę AI, która może zaspokoić wiele potrzeb funkcjonalnych, takich jak HR, finanse, prawo i operacje. Jego wielkość rynkowa jest znacznie większa niż tradycyjnego SaaS.
Ta transformacja doprowadzi do polaryzacji branży: tradycyjni dostawcy oprogramowania jako usługi (SaaS), którym brakuje możliwości w zakresie modeli AI i którzy nie potrafią zintegrować doświadczenia branżowego z technologią agentów, będą musieli zmierzyć się z ryzykiem zastąpienia ich; z kolei dostawcy, którzy potrafią szybko przeprowadzić transformację AI i połączyć dogłębną wiedzę branżową z technologią agentów oraz optymalizacją mocy obliczeniowej, zdobędą większy udział w rynku.
6.4 Przetwarzanie brzegowe i wdrożenia prywatne stały się nowymi arenami konkurencji.
Obecnie główne atuty firmy Nvidia koncentrują się głównie na rynku mocy obliczeniowej centrów danych w chmurze, natomiast rozwiązania takie jak sztuczna inteligencja brzegowa i wdrożenia prywatne stają się nowymi kierunkami wzrostu i obszarami konkurencji w branży, a także potencjalnymi wyzwaniami dla firmy Nvidia.
Aplikacje AI na poziomie korporacyjnym w tradycyjnych branżach, ograniczone przepisami i prywatnością danych, preferują wdrożenia prywatne i przetwarzanie brzegowe. Qualcomm, AMD, Broadcom i inni producenci inwestują w rynek AI brzegowej, wprowadzając na rynek procesory NPU i układy AI zoptymalizowane pod kątem przetwarzania brzegowego. Obecnie żaden gracz nie zdobył dominującej pozycji na tym rynku, ale gdy wejdzie on w okres szybkiego wzrostu, pojawi się nowy krajobraz konkurencyjny.
Podczas tegorocznej konferencji GTC, NVIDIA szybko zaprezentowała również swoje produkty GGX Small Box i stacje robocze AI do zastosowań brzegowych i prywatnych, przyspieszając swoją ekspansję w tym sektorze. Przewiduje się, że w ciągu najbliższych 3-5 lat, rozwiązania brzegowe AI i wdrożenia prywatne staną się kluczowymi obszarami konkurencji na rynku mocy obliczeniowej AI i kluczowymi czynnikami wpływającymi na sytuację w branży.
VII. Ostrzeżenie o ryzyku
Ryzyko niespełnienia oczekiwań przez wdrożenie aplikacji AI: Głównym celem firmy NVIDIA, którego wartość to bilion dolarów, jest wdrożenie na dużą skalę aplikacji agentowych i AI. Jeśli penetracja branży przez aplikacje AI będzie niższa niż oczekiwano, doprowadzi to do spowolnienia wzrostu zapotrzebowania na moc obliczeniową, co wpłynie na terminową realizację zamówień.
Ryzyko niespełnienia oczekiwań w zakresie rozbudowy łańcucha dostaw: Rozwój zaawansowanych możliwości TSMC w zakresie procesów i pakowania, pojemności pamięci HBM oraz infrastruktury centrów danych podlega sztywnym cyklom i niepewności. Jeśli rozbudowa łańcucha dostaw będzie wolniejsza niż oczekiwano, bezpośrednio ograniczy to dostawy chipów Nvidii i realizację zamówień.
Ryzyko zaostrzenia konkurencji w branży: Google, AMD, wiodący dostawcy usług w chmurze i producenci modeli na dużą skalę rozwijają swoje samodzielnie opracowane układy AI. Jeśli produkty konkurencji osiągną przełom technologiczny, zmniejszy to udział Nvidii w rynku i doprowadzi do pogorszenia sytuacji konkurencyjnej w branży.
Ryzyko wolniejszej niż oczekiwano iteracji technologii: Jeśli nastąpią drastyczne zmiany w architekturze dużego modelu lub w planie rozwoju technologii układów AI, obecne technologiczne i produktowe atuty firmy NVIDIA zostaną osłabione, a jej podstawowa konkurencyjność ucierpi.
Ryzyko związane z globalną polityką regulacyjną: Ciągłe zaostrzanie kontroli eksportu i przepisów antymonopolowych dotyczących układów scalonych AI i przemysłu półprzewodników przez główne gospodarki światowe może niekorzystnie wpłynąć na globalną sprzedaż firmy Nvidia oraz badania i rozwój technologii;
Ryzyko zmienności makroekonomicznej: Globalna zmienność makroekonomiczna doprowadzi do ograniczenia wydatków kapitałowych przedsiębiorstw i dostawców usług w chmurze, spadku popytu na moc obliczeniową AI i negatywnego wpływu na wolumen zamówień firmy Nvidia.
VIII. Perspektywy branży i ocena przyszłych trendów
8.1 Trend krótkoterminowy (1-2 lata)
Ograniczenia w dostępności mocy obliczeniowej będą się utrzymywać: niedobory mocy w łańcuchu dostaw półprzewodników i infrastrukturze centrów danych prawdopodobnie nie znikną w krótkim okresie, a ograniczone zasoby mocy obliczeniowej dla sztucznej inteligencji będą się utrzymywać do 2026 r., przy czym ceny układów scalonych i mocy obliczeniowej pozostaną wysokie.
Udział popytu na wnioskowanie nadal rośnie: koszty wnioskowania szybko wzrosną do ponad 70% całkowitych kosztów mocy obliczeniowej sztucznej inteligencji, a układy wnioskowania o niskim opóźnieniu i rozwiązania do optymalizacji wnioskowania staną się przedmiotem zainteresowania badań i rozwoju oraz inwestycji w branży;
Model wielu odlewni firmy Nvidia został oficjalnie wprowadzony: Nvidia będzie stopniowo przechodzić od wyłącznej odlewni dla TSMC do modelu wielu odlewni, w którym TSMC będzie głównym dostawcą, a Samsung i Intel będą dostawcami drugorzędnymi. Ma to na celu złagodzenie ograniczeń w zakresie zdolności produkcyjnych i zagwarantowanie realizacji zamówień.
Aplikacje agentów wkraczają w fazę wdrożeń na szeroką skalę: produkty agentów klasy C osiągną zasięg dużej liczby użytkowników, a wdrażanie agentów na poziomie przedsiębiorstw będzie szybko postępować, stając się główną siłą napędową wzrostu zapotrzebowania na tokeny.
8.2 Trendy średnioterminowe i długoterminowe (3-5 lat)
Heterogeniczna moc obliczeniowa staje się coraz bardziej powszechna w branży: przyszłe systemy mocy obliczeniowej AI będą tworzyć heterogeniczną architekturę hybrydową „GPU + LPU + CPU + połączenie optyczne”. Różne architektury układów scalonych są dostosowywane do różnych scenariuszy zastosowań, co oficjalnie prowadzi do powstania zróżnicowanego wzorca mocy obliczeniowej.
Ekosystem Nvidii stale się rozwija, a jej wiodąca pozycja pozostaje solidna: Nvidia będzie nadal umacniać swoją pozycję jako operator infrastruktury AI, a jej ekosystem full-stack stale się rozwija. Nawet jeśli jej udział w rynku spadnie, jej wiodąca pozycja w branży pozostanie niezachwiana.
Model AaaS stopniowo zastępuje tradycyjny SaaS: AaaS (Agent as a Service) stanie się dominującym modelem biznesowym dla usług korporacyjnych, a rynek usług korporacyjnych przejdzie całkowitą restrukturyzację. Dostawcy z doświadczeniem w branży i możliwościami optymalizacji mocy obliczeniowej staną się głównymi uczestnikami rynku.
Edge AI staje się nowym, dynamicznie rozwijającym się obszarem: Rynek edge AI i wdrożeń prywatnych wejdzie w okres gwałtownego wzrostu, stając się nowym kierunkiem rozwoju dla branży rozwiązań obliczeniowych AI i kluczowym elementem konkurencji branżowej;
Krajobraz łańcucha dostaw półprzewodników ulega zmianom: globalni producenci półprzewodników będą nadal rozwijać swoje zaawansowane możliwości przetwarzania i pakowania, a stopniowo kształtuje się zdywersyfikowany łańcuch dostaw, zmniejszający zależność od jednego producenta lub regionu.

