Data raportului: aprilie 2026
Domeniul de cercetare: lansările cheie de la conferința GTC 2026 a NVIDIA, structura cererii și ofertei în industria puterii de calcul AI, lanțul de aprovizionare cu semiconductoare, competitivitatea chip-urilor AI, transformările modelului de afaceri în industria AI
Declarație cheie: Acest raport este doar pentru cercetare și analiză în industrie și nu constituie un sfat de investiții
Rezumat
La conferința GTC 2026, fondatorul companiei NVIDIA, Jensen Huang, a propus un obiectiv central: până la sfârșitul anului 2027, volumul total al comenzilor pentru platformele Blackwell și Vera Rubin va depăși 1 trilion de dolari. Acest obiectiv a atras o atenție globală semnificativă din partea industriei tehnologice și de semiconductoare. Acest raport, bazat pe experiența de primă linie a investitorilor din industria AI, foștilor lideri de dezvoltare de la NVIDIA, arhitecți de chipuri de top și operatori de infrastructură cloud GPU, analizează în detaliu logica de bază care susține acest obiectiv de 1 trilion, principalele obstacole în implementare, evoluția apărării companiei și impactul său disruptiv asupra structurii globale a industriei de putere de calcul AI, lanțului de aprovizionare cu semiconductoare și modelului de afaceri al serviciilor pentru întreprinderi.
Cercetările arată că sprijinul central pentru obiectivul de un trilion al Nvidia provine din transformarea fundamentală a structurii costurilor puterii de calcul AI de la „predominanța antrenării” la „predominanța inferenței”, precum și din explozia cererii de Token generată de agenții inteligenți; iar factorii de restricție în realizarea obiectivului de un trilion s-au mutat de la capacitatea de design a chip-urilor la constrângerile de capacitate din întreaga lungă a lanțului de aprovizionare al semiconductorilor și construcția energiei pentru centrele de date. Pe termen scurt, poziția de lider a Nvidia în domeniul puterii de calcul AI rămâne stabilă, ecosistemul complet și controlul lanțului de aprovizionare rămân avantajele sale centrale; pe termen mediu și lung, piața globală de putere de calcul se va diversifica treptat, AI edge și desfășurările agenților la nivel de întreprindere vor deveni noi direcții de creștere și arene centrale de competiție în industrie.
I. Concluzii esențiale
Obiectivul de un trilion dispune de un suport clar pentru cerere, iar progresul implementării depinde de viteza de penetrare a industriei Agent: comenzile de un trilion ale Nvidia nu sunt doar o previziune de vânzări, ci o mișcare esențială în tranziția sa de la furnizor de GPU-uri la operator de infrastructură AI. Cererea de inferență a devenit motorul principal al creșterii pe termen lung a puterii de calcul AI, iar în următorii 1-2 ani, costurile de inferență vor reprezenta 70%-80% din costul total de putere de calcul, desfășurarea pe scară largă a agenților inteligenți va impulsiona rapid creșterea cererii de Token, oferind un suport central pentru obiectivul de un trilion.
Constrângerile din întregul lanț de aprovizionare sunt principala restricție în atingerea obiectivului de un trilion: expansiunea capacității în industria semiconductorilor are un ciclu rigid, iar capacitățile de procesare de 3nm de la TSMC, capacitățile avansate de ambalare CoWoS, furnizarea de memorie HBM de mare lățime de bandă, livrarea energiei pentru centrele de date și capacitatea de construcție reprezintă cele patru mari obstacole care restricționează implementarea puterii de calcul. Starea de deficit a componentelor de suport din întreaga industrie se estimează că va continua până la sfârșitul anului 2027, afectând direct progresul livrării comenzilor și realizarea obiectivelor Nvidia.
Fosa de apărare centrală a Nvidia a fost complet actualizată, iar o singură descoperire tehnologică nu poate afecta poziția sa de lider: barierele competitive centrale ale companiei s-au transformat dintr-un singur ecosistem software CUDA într-o capacitate cuprinzătoare de proiectare a chip-urilor AI, un ecosistem complet de software și hardware, control absolut asupra lanțului de aprovizionare și un sistem ecologic de dezvoltatori. Deși Agentul de Codare a redus pragul de optimizare a Kernel-ului CUDA, nu poate replica capacitatea sa de optimizare la nivel de sistem complet și coeziunea ecologică.
Piața globală de putere de calcul se va îndrepta spre diversificare și heterogenitate, iar oportunitățile de antreprenoriat în domeniul chip-urilor de inferență generice sunt limitate: viitorul sistemului de putere de calcul AI va forma o arhitectură mixtă heterogenă „GPU+LPU+CPU+interconexiune optică”, iar chip-urile TPU de la Google, seria MI de la AMD și chip-urile dezvoltate de furnizorii cloud vor ocupa o parte de piață în scenarii de nișă, iar monopolul absolut al Nvidia va fi atenuat. Însă oportunitățile de antreprenoriat în domeniul chip-urilor de inferență generice s-au închis practic, iar oportunitățile esențiale de dezvoltare pentru start-up-uri sunt de a completa ecosistemul Nvidia și inovația colaborativă în sectoare de nișă.
AaaS va reconstrui modelul de afaceri pentru serviciile de întreprindere, iar modelul SaaS tradițional se confruntă cu presiuni de transformare: Maturizarea tehnologiei agentului va impulsiona tranziția serviciilor de întreprindere de la modelul standardizat SaaS, la un model de tip AaaS (Agent as a Service) foarte personalizat. Cheltuielile centrale ale întreprinderilor se vor transforma din achiziția de software IT în achiziția de forță de muncă AI, iar furnizorii cu experiență în industrie și capacități de optimizare a puterii de calcul vor obține noi oportunități de creștere, în timp ce furnizorii SaaS tradiționali care nu dispun de capacități de model AI se vor confrunta cu riscul de a fi înlocuiți.
II. Fundamentele cercetării
Conferința GTC Nvidia care va avea loc în martie 2026 va fi un important indicator pentru industria AI și semiconductorilor. În timpul conferinței, Jensen Huang a propus obiectivul central care va influența industria: până la sfârșitul anului 2027, volumul total de comenzi pentru platformele Blackwell și Vera Rubin va fi de cel puțin un trilion de dolari.
Impactul acestei ținte asupra industriei nu trebuie subestimat: în 2024, venitul anual global din semiconductori va depăși 600 de miliarde de dolari, iar Nvidia plănuiește să depășească acest volum în 3 ani, având ca bază o singură companie și două platforme de produse. Această țintă reflectă contradicția centrală a industriei AI: cererea explodează în direcția unei puteri de calcul de trilioane de dolari, însă oferta se confruntă cu constrângeri rigide pe tot lanțul, de la capacitățile avansate de fabricare a wafere-lor și tehnologia de ambalare, până la livrarea de energie.
Între timp, la această conferință GTC, Nvidia a realizat cea mai mare lansare de produse simultan din istorie: platforma Vera Rubin a lansat simultan 7 chip-uri complet noi, iar eficiența inferenței este de 10 ori mai mare decât platforma Blackwell, costul pe Token a scăzut la 1/10 din original; la doar 4 luni după finalizarea achiziției Grok, a lansat oficial chip-ul de inferență LPU, acoperind complet sectorul inferenței cu latență redusă; de asemenea, a lansat ecosistemul software Nemo Cloud, concentrându-se pe intrarea principală pentru implementarea agenților de nivel enterprise, completând astfel de la hardware la software, de la antrenare la inferență, de la chip-uri la infrastructura centrului de date.
Acest raport analizează fezabilitatea, impactul industrial și transformările din industrie ale obiectivului de un trilion al Nvidia, oferind o referință cuprinzătoare și obiectivă pentru participanții din industrie și investitori.
III. Logica de sprijin de bază a obiectivului de un trilion al Nvidia
3.1 Reconstrucția fundamentală a poziționării strategice: de la furnizor de GPU-uri la operator de infrastructură AI
Obiectivul de un trilion propus de Jensen Huang nu se limitează doar la extinderea vânzărilor de chip-uri, ci reflectă o ajustare completă a poziționării comerciale a Nvidia — de la cea mai mare companie de design de chip-uri GPU din lume, la un operator de infrastructură în era inteligenței artificiale, creând o fabrică de putere de calcul AI care acoperă întreaga industrie.
Zhang Lu, fondator și partener de gestionare al Fusion Fund, afirmă că producția comercială centrală a Nvidia nu mai este hardware-ul GPU, ci forța de muncă centrală în era AI — Token. Această ajustare de poziționare a permis Nvidia să depășească limitările pieței tradiționale de chip-uri semiconductoare, aliniindu-se precis cu oportunitățile de creștere pe termen lung ale transformării economiei digitale.
Din perspectiva modelului de afaceri, Nvidia a realizat trecerea de la „vânzarea produselor hardware” la „oferirea de soluții complete de infrastructură de putere de calcul”. La conferința GTC, Nvidia nu doar că a lansat produse chip-uri, ci a introdus și soluții modulare de centre de date AI prefabricate, reducând perioada de construcție a centrelor de date de la 18-20 de luni la 6-9 luni, esențial oferind clienților o „fabrică de putere de calcul AI” „gata de utilizare”, realizând astfel o actualizare a modelului de afaceri de la vânzarea de chip-uri unice la servicii de infrastructură pe parcursul întregii durate de viață, oferind un suport logic puternic pentru obiectivul de un trilion.
3.2 Inversarea structurii costurilor puterii de calcul: cererea de inferență devine motorul central de creștere pe termen lung
Logica cererii centrale care susține obiectivul de un trilion este transformarea fundamentală a structurii costurilor puterii de calcul AI: costurile puterii de calcul din industrie s-au mutat rapid de la „predominanța antrenării” la „predominanța inferenței”, cererea de inferență devenind o sursă de flux de numerar pe termen lung, stabil și scalabil.
În stadiul incipient al dezvoltării industriei AI, costurile cu puterea de calcul sunt concentrate în mare parte pe etapa de pre-antrenare a modelului. În 2023, 70%-80% din costurile chip-urilor cu puterea de calcul din industrie sunt alocate antrenării modelului, care reprezintă o investiție unică în active fixe, iar cererea este concentrată în rândul câtorva mari furnizori de modele, având un spațiu de creștere relativ limitat.
Odată cu maturizarea tehnologiei modelului mare, costurile de inferență cresc rapid: în prezent, costurile de antrenare și inferență ale principalelor companii de modele mari sunt practic egale; se estimează că în 2025-2026, costurile de inferență vor reprezenta 70%-80% din costul total al puterii de calcul AI, devenind cea mai mare cheltuială din industrie.
Datele dezvăluite de Jensen Huang la conferință confirmă această tendință: în ultimii doi ani, volumul de calcul pentru inferență a crescut de 10.000 de ori, utilizarea Token-ului a crescut de 100 de ori, cererea globală de calcul a crescut de 1.000.000 de ori, și această tendință de creștere continuă. Spre deosebire de investițiile unice în antrenare, cererea de inferență este constantă și frecventă, crescând pe măsură ce aplicațiile AI se infiltrează, oferind suport pe termen lung și stabil pentru obiectivul de un trilion al Nvidia.
3.3 Explozia agenților inteligenți, conducând la creșterea exponențială a cererii de Token
Explozia cererii de inferență este în principal datorată desfășurării pe scară largă a agenților inteligenți. Spre deosebire de apelurile unice ale modelului mare, agenții inteligenți necesită o conectare constantă, răspunsuri în timp real și interacțiuni multi-ron, ceea ce impune cerințe ridicate de latență redusă, procesare pe termen lung și capacitatea de generare de Token-uri pentru utilizatori unici, impulsionând semnificativ consumul de Token-uri.
La această conferință GTC, „Open Cloud” a fost unul dintre cele mai menționate cuvinte cheie de către Jensen Huang, având ca scop principal adaptarea la desfășurarea pe scară largă a agenților inteligenți. Mai mulți experți din industrie consideră că agenții vor deveni, după PC-uri și internetul mobil, principalul vehicul pentru serviciile de întreprindere și internetul de consum din următoarea generație, iar cerințele lor de putere de calcul vor depăși cu mult aplicațiile tradiționale de internet.
Din perspectiva progresului implementării, viteza de penetrare a aplicațiilor Agent în piața din China a depășit-o pe cea din Statele Unite, produsele Agent reprezentate de ByteDance Doubao au realizat o popularizare pe scară largă printre utilizatorii finali; piața din SUA se concentrează în prezent pe AI Coding la nivel de întreprindere și dezvoltarea de modele multimodale, dar implementarea agenților la nivel de întreprindere progresează rapid. Pe măsură ce tehnologia agentului se maturizează continuu, cerințele de consum de Token vor deveni motorul principal al creșterii țintei de un trilion a Nvidia.
IV. Obstacolele centrale și constrângerile lanțului de aprovizionare în vederea realizării obiectivului de un trilion
Realizarea obiectivului de un trilion trebuie să facă față în primul rând constrângerilor fizice din industria semiconductorilor și construcțiilor. Mai mulți experți din industrie consideră că principalul obstacol care împiedică realizarea obiectivului de un trilion al Nvidia nu mai este capacitatea de design a chip-urilor, ci restricțiile de capacitate din întregul lanț de aprovizionare al semiconductorilor și constrângerile rigide din construcția centrelor de date.
4.1 Constrângerile centrale ale capacităților avansate de procesare și ambalare
În etapa de fabricare a wafere-lor, procesul de 3nm de la TSMC este baza pentru platformele Blackwell și Vera Rubin ale Nvidia, iar capacitatea TSMC determină direct limita de livrare a chip-urilor Nvidia. Comparativ cu capacitatea wafere-lor de 3nm, un obstacol mai evident este capacitatea avansată de ambalare CoWoS.
Ambalarea avansată CoWoS este procesul esențial pentru realizarea unei lățimi de bandă mari și a unei performanțe ridicate a chip-urilor AI, fiind și punctul slab central al industriei puterii de calcul AI în prezent. Începând cu 2024, TSMC a extins capacitatea CoWoS de 3 ori și continuă să își extindă capacitatea, dar tot nu reușește să satisfacă cererea explozivă a industriei.
În baza colaborării profunde cu TSMC de peste douăzeci de ani, Nvidia a blocat cea mai mare parte a capacității CoWoS de la TSMC, ceea ce este atât un avantaj central al lanțului său de aprovizionare, cât și o restricție principală pentru extinderea capacității. Chiar dacă Nvidia are o cerere de un trilion de dolari, extinderea capacității de ambalare avansată a TSMC are un ciclu rigid, care nu poate crește rapid pe termen scurt, limitând direct volumul de livrare a chip-urilor Nvidia.
4.2 Deficitul de aprovizionare pe întregul lanț de chip-uri de memorie
Performanța chip-urilor AI depinde în mare măsură de suportul memoriei de mare lățime de bandă (HBM), care a devenit o necesitate esențială în industria puterii de calcul AI. Înainte și după conferința GTC, Micron și Samsung au anunțat că HBM4 este acum produs în masă, iar acești trei mari furnizori avansează în continuare cu soluțiile personalizate pentru HBM4e pentru a se adapta cerințelor noii generații de platforme Nvidia.
Însă extinderea capacității HBM se confruntă cu restricții stricte de proces, iar deficitul de capacitate HBM a dus la o lipsă în lanțul de aprovizionare a chip-urilor de memorie: capacitatea chip-urilor de memorie DDR și SSD este restrânsă de HBM, iar prețul chip-urilor de memorie din întreaga industrie continuă să crească, cu o creștere de 100%-200% pentru produsele relevante în ultimul an. Conform informațiilor din prima linie a lanțului de aprovizionare, se estimează că deficitul de chip-uri de memorie va continua până la sfârșitul anului 2027, devenind unul dintre principalele obstacole pentru implementarea puterii de calcul.
4.3 Tavanul rigid al construcției centrelor de date și livrarea energiei
Comanda de un trilion de dolari a Nvidia trebuie să ajungă în cele din urmă în centrele de date reale. În prezent, cel mai mare obstacol în calea implementării puterii de calcul nu mai este chip-ul în sine, ci capacitatea de construcție a centrelor de date, în special furnizarea de energie.
Alex, fondatorul GMI Cloud, unul dintre principalii furnizori de servicii cloud GPU la nivel global, afirmă că pentru a realiza venituri de un trilion de dolari, principala limitare este viteza de construcție a centrelor de date, iar primul obstacol în construcția centrelor de date este energia. În prezent, rețeaua publică din SUA nu mai dispune de energie industrială disponibilă de peste 10 MW, iar 90% dintre noile centre de date construite adoptă modelul Behind the Meter — ocolind rețeaua publică, construind generatoare pe gaz pentru a asigura energie autonomă, iar unele mari companii cloud chiar închiriază centrale nucleare pentru a furniza energie exclusivă centrelor de date.
SUA nu duce lipsă de capacitate de generare a energiei, principalul obstacol aflându-se în cadrul livrării energiei. Construcția stațiilor de transformare din rețeaua publică și livrarea energiei de înaltă tensiune sunt supuse unor restricții stricte de reglementare, având perioade lungi de aprobat și o viteză de desfășurare lentă, nereușind să țină pasul cu ritmul de construcție al centrelor de date AI, acest obstacol rigid determinând limita de expansiune a infrastructurii globale de putere de calcul, influențând indirect progresul livrării comenzilor de un trilion al Nvidia.
4.4 Riscul de deficit al componentelor de suport din întreaga industrie
Pe lângă chip-urile esențiale, memorie și energie, întregul lanț de infrastructură AI se confruntă cu probleme de aprovizionare strânse. Datele operaționale din prima linie arată că deficitul s-a extins de la chip-urile esențiale la întregul lanț de aprovizionare: echipamentele CX7 de la Nvidia BlueField, CPU-urile serverelor Intel, soluțiile de răcire cu apă pentru centrele de date, modulele optice și alte componente esențiale sunt în prezent în deficit, iar termenul de livrare se extinde constant.
Un server AI de înaltă performanță conține peste 200.000 de componente independente, iar lipsa oricărui element va afecta livrarea finală a serverului și implementarea puterii de calcul. Aceasta înseamnă că obiectivul de un trilion al Nvidia nu poate fi atins doar cu forțele proprii, ci necesită expansiunea sincronizată a întregului lanț de semiconductori, producție electronică și centre de date, iar expansiunea colaborativă a întregului lanț de aprovizionare prezintă o incertitudine semnificativă.
V. Fosa de apărare centrală a Nvidia și capacitatea de actualizare tehnologică
În fața competiției din întreaga industrie și a constrângerilor lanțului de aprovizionare, Nvidia poate să propună o țintă de un trilion de dolari, bazându-se pe bariera tehnologică tot mai puternică și pe avantajele ecosistemului său complet. La conferința GTC, fosa de apărare centrală a Nvidia a fost complet actualizată, formând avantaje competitive multidimensionale.
5.1 Revoluția designului chip-urilor condusă de AI, viteza de actualizare a crescut semnificativ
La această conferință GTC, Nvidia a lansat simultan 7 chip-uri complet noi, produse în masă, prin platforma Vera Rubin, ceea ce reprezintă cea mai mare lansare de produse simultan din istoria sa, rupând ritmul tradițional al ciclului de actualizare din industria semiconductorilor.
Cu câțiva ani în urmă, ritmul obișnuit al industriei semiconductorilor era de a lansa un chip flagship la fiecare 2 ani, iar pentru cei mai importanți jucători, lansarea a 1-2 chip-uri noi pe an era considerată un lider al industriei. Nvidia a reușit să realizeze dezvoltarea și producția simultană a mai multor chip-uri într-un an, principalul motiv fiind integrarea profundă a AI în întregul proces de proiectare a chip-urilor.
Dr. Mark Ren, fost director de cercetare la Nvidia și fondator și CEO al Agentris, a dezvăluit că Nvidia a implementat pe scară largă Agentul de Codare, îmbunătățind semnificativ eficiența inginerilor de proiectare a chip-urilor. Încă din 2023, Nvidia a lansat proiectul Chip Nemo - bazat pe datele legate de proiectarea chip-urilor de peste 200 de miliarde de Token-uri, antrenând un model mare specializat, acoperind întregul proces de proiectare a chip-urilor, de la interpretarea cerințelor de proiectare, generarea codului hardware RTL, până la optimizarea performanței chip-ului și ajustarea consumului de energie, AI a fost integrată profund în fiecare etapă a proiectării chip-urilor.
Modelele tradiționale de învățare automată pot rezolva doar probleme locale în proiectarea chip-urilor, iar maturizarea tehnologiilor de limbaj mare și agent a realizat cu adevărat capacitatea generală de proiectare a chip-urilor, ceea ce este esențial pentru Nvidia în avansarea rapidă a dezvoltării simultane a mai multor chip-uri și pentru reducerea continuă a ciclului de actualizare, creând un avantaj de dezvoltare greu de replicat pentru alte companii.
5.2 Inovația arhitecturală completează deficiențele de inferență, LPU fixează următoarea generație de putere de calcul
La conferința GTC, Nvidia a lansat oficial chip-ul de inferență LPU bazat pe tehnologia Grok la doar 4 luni după achiziția Grok, iar Jensen Huang a sugerat că „toate centrele de date din viitor ar trebui să aloce 25% din spațiu pentru chip-urile de inferență, reprezentate de Grok”. Această mișcare marchează faptul că Nvidia a completat în totalitate deficiențele sale în domeniul inferenței cu latență redusă, stabilind un avantaj central în arhitectura puterii de calcul din generația următoare.
Dr. Xiao Zhibin, fost arhitect de chip-uri la Alibaba, a analizat avantajele arhitecturale esențiale ale Grok LPU: chip-urile AI tradiționale folosesc în general arhitectura DRAM, bazându-se pe stocarea greutăților modelului în memorie externă de mare capacitate, ceea ce nu doar că generează întârzieri mari în accesare, dar necesita și reîmprospătare dinamică; în schimb, Grok LPU folosește arhitectura SRAM pură pe chip, eliminând DRAM-ul, stocând toate greutățile modelului și KV Cache în SRAM-ul de pe chip, cu o întârziere de acces de doar 1-2 nanosecunde, realizând extinderea grupurilor prin conectivitate eficientă pe chip, adaptându-se bine cerințelor de latență scăzută ale aplicațiilor Agent.
Din perspectiva logicii fundamentale a inferenței modelului mare, inferența modelului mare se împarte în două etape: Encoder pentru procesarea de volum mare cu GPU și Decoder pentru generarea de latență scăzută, fiecare generând un token pe rând; fiecare token necesită citirea repetată a greutăților modelului, iar cea mai mare parte a timpului se pierde în comunicarea greutăților, nu în calcul. Grok LPU plasează toate greutățile pe chip, eliminând complet costurile de comunicare, iar în scenariile de generare a Token-ului pentru utilizatori unici, eficiența este de peste 30 de ori mai mare comparativ cu GPU.
Mai mulți experți din industrie consideră că viitorul sistem de putere de calcul AI va fi cu siguranță o arhitectură mixtă heterogenă - GPU-urile pentru procesarea loturilor Encoder, LPU-urile pentru generarea de latență scăzută Decoder, diferite arhitecturi de chip-uri adaptându-se la diferite operațiuni și scenarii. Nvidia, prin achiziția Grok, a obținut în avans avantajul central în arhitectura inferenței de generație următoare, consolidându-și și mai mult poziția de lider în piața puterii de calcul în toate scenariile.
5.3 Evoluția barierei ecologice CUDA, ecosistemul complet rămâne greu de replicat
Avantajul central al Nvidia în ultimii douăzeci de ani a fost ecosistemul software centrat pe CUDA. Odată cu dezvoltarea rapidă a Agentului de Codare, s-a născut opinia că „bariera CUDA se slăbește”. Studiul din acest raport arată că Agentul de Codare a redus într-adevăr pragul de optimizare a Kernel-ului CUDA, dar fosa de apărare a Nvidia s-a transformat dintr-un singur strat software CUDA într-un ecosistem complet de infrastructură AI, avantajul său rămâne greu de replicat.
Din punct de vedere tehnic, codul CUDA generat de AI a atins deja un nivel de optimizare de peste 90% comparativ cu optimizarea manuală, dar avantajul central al Nvidia constă în experiența sa de design hardware, datele de depanare la nivel de sistem și capacitatea de optimizare pe întreaga durată a procesului, aceste date și experiențe centrale nu pot fi obținute de Agentul de Codare și sunt greu de replicat de alți furnizori.
Din perspectiva ecologică, avantajul CUDA nu se află doar în tehnologia sa, ci și în comunitatea globală cea mai mare de dezvoltatori GPU formată de aceasta. Nvidia a cultivat peste 20.000 de start-up-uri prin Programul Inception, având o coeziune puternică a dezvoltatorilor și o influență ecologică. Chiar dacă alți furnizori replică funcționalitatea CUDA, este greu să construiești o astfel de comunitate de dezvoltatori în termen scurt.
Mai important, la această conferință GTC, Nvidia și-a extins strategia ecologică de la uneltele de dezvoltare de bază la nivelul aplicațiilor Agent, lansând ecosistemul software Nemo Cloud, realizând o interconectare completă cu Open Cloud, concentrându-se pe intrarea principală pentru desfășurarea agenților la nivel enterprise, stabilind regulile industriei în era agenților, completând astfel un ciclu ecologic de la instrumente de bază la aplicații de vârf, iar acest avantaj ecologic nu poate fi afectat de o simplă replicare a CUDA.
5.4 Avantajul central al controlului asupra lanțului de aprovizionare
Un alt avantaj central al Nvidia este controlul său absolut asupra lanțului de aprovizionare a semiconductorilor. Datorită celei mai mari dimensiuni a achizițiilor de chip-uri AI din lume și a unei colaborări profunde de peste douăzeci de ani cu TSMC, Nvidia a blocat cea mai mare parte a capacității de procesare de 3nm de la TSMC și a ambalării avansate CoWoS, ceea ce reprezintă o barieră greu de depășit pentru concurenți precum AMD și Google pe termen scurt.
Chiar și atunci când AMD, Google și altele obțin comenzi de clienți, este greu să concureze cu Nvidia în capacitățile avansate de procesare și ambalare. În același timp, Nvidia își desfășoară activitatea în direcția „TSMC predominant, Samsung + Intel în sprijin” pentru un model de multi-fabricare, lărgind astfel canalele de aprovizionare și îmbunătățind stabilitatea lanțului de aprovizionare. Această capacitate acumulată pe termen lung de control al lanțului de aprovizionare este un suport important pentru realizarea obiectivului de un trilion al Nvidia și este o avantaj central pe care concurenții nu îl pot replica.
VI. Analiza structurii competitive din industrie și a oportunităților de piață
6.1 Piața globală de putere de calcul va forma un model diversificat și heterogen, iar poziția de lider a Nvidia va rămâne stabilă
Raportul de cercetare sugerează că piața puterii de calcul AI din viitor nu va forma un monopol absolut dominat de Nvidia, ci va forma un model diversificat și heterogen, în care Nvidia va domina, iar mai mulți furnizori vor concura în mod diferențiat în scenarii de nișă.
Din perspectiva concurenților, chip-urile TPU de la Google, susținute de optimizarea completă a ecosistemului său, au costuri de antrenare de doar 1/3 din cele ale ChatGPT, având o performanță excepțională, dar acest avantaj este limitat la ecosistemul Google, iar companiile terțe au dificultăți în a obține efecte de optimizare comparabile; seria de chip-uri MI de la AMD își extinde treptat cota de piață în segmentul mediu și scăzut al puterii de calcul, obținând o cotă de piață semnificativă în scenariile de inferență; furnizorii de cloud și marii furnizori de modele precum OpenAI, Meta, Amazon și altele își desfășoară activitatea pentru a-și dezvolta chip-uri interne, realizând optimizări personalizate pentru propriile scenarii, ceea ce va afecta cota de piață a Nvidia.
Însă pe termen scurt, poziția de lider a Nvidia rămâne greu de contestat. Avantajul său central constă în faptul că, ca furnizor terț de servicii, poate oferi optimizare la nivel de sistem pentru clienți din industrii și cu cerințe diferite, o capacitate pe care alte companii focalizate pe propriul ecosistem sunt greu de depășit. În plus, ecosistemul său complet, eficiența dezvoltării, controlul lanțului de aprovizionare și alte avantaje centrale rămân la un nivel de conducere în industrie.
6.2 Fereastra de oportunitate pentru antreprenoriatul chip-urilor de inferență generice este practic închisă, dar sectoarele de nișă oferă încă oportunități
Pe măsură ce Nvidia se stabilește puternic în domeniul inferenței, industria se întreabă în mod obișnuit: mai există oportunități de dezvoltare pentru start-up-urile de chip-uri AI?
Mai mulți experți din industrie consideră că oportunitățile de antreprenoriat în domeniul chip-urilor de inferență generice s-au închis practic, dar în sectoarele non-centrale și în domeniile slabe ale Nvidia există încă un spațiu semnificativ pentru inovație și colaborare.
În domeniul chip-urilor de inferență generice, Nvidia a realizat optimizarea completă a infrastructurii AI, având o capacitate internă de inovație puternică, iar pe piața sa centrală, start-up-urile nu pot concura cu Nvidia din punct de vedere al investițiilor în resurse sau eficienței actualizării. De asemenea, coeziunea dezvoltatorilor din ecosistemul CUDA face ca chip-urile generice ale start-up-urilor să obțină greu recunoaștere pe piață.
Oportunitățile esențiale de dezvoltare pentru start-up-uri constau în evitarea arenei centrale a Nvidia, concentrându-se pe domeniile sale actuale non-centrale și pe punctele slabe tehnologice, devenind completatori ai ecosistemului Nvidia și nu înlocuitori. Oportunitățile principale sunt concentrate în trei direcții:
Domeniul interconectării puterii de calcul: viitorul clusterelor de putere de calcul AI va avea ca principal obstacol interconectarea între chip-uri și transmiterea datelor, următoarea generație de interconexiune de mare viteză, switch-uri optice și chip-uri de interconexiune optică aparțin domeniului non-central al Nvidia și pot forma o bună sinergie strategică cu afacerea centrală a Nvidia;
Domeniul optimizării heterogene la nivel de sistem: viitoarele centre de date AI vor fi un sistem heterogen integrat din GPU, LPU, CPU, switch-uri optice etc., iar în acest domeniu există o cerere semnificativă pentru integrare, simulare și optimizare, iar furnizorii de chip-uri precum Nvidia și AMD nu pot oferi servicii de optimizare neutră pe întreaga lungime a lanțului, ceea ce reprezintă o oportunitate centrală pentru start-up-uri;
Domeniul chip-urilor personalizate pentru scenarii verticale: în scenarii verticale precum robotică, conducere autonomă, AI industrial, este necesară optimizarea arhitecturală personalizată pentru scenarii, aceste sectoare nu sunt punctele de concentrare ale Nvidia, iar start-up-urile pot obține un avantaj competitiv diferențiat prin înțelegerea profundă a scenariilor.
6.3 Reconstrucția modelului comercial în era agenților, AaaS afectează SaaS
La conferința GTC, Jensen Huang a propus un nou model de afaceri AaaS (Agent as a Service), provocând direct modelul SaaS care domină piața software-ului pentru întreprinderi de peste douăzeci de ani, marcând o schimbare fundamentală în modelul de afaceri pentru serviciile de întreprindere în era AI.
Nucleul modelului SaaS tradițional este furnizarea de servicii software standardizate pentru întreprinderi, indiferent de industrie sau dimensiune, companiile folosind aceeași suită de produse standardizate; iar maturizarea tehnologiei agentului a făcut posibilă furnizarea de servicii de întreprindere extrem de personalizate și individualizate. În viitor, investițiile centrale ale companiilor se vor transforma din „bugetele de achiziție a software-ului IT” în „bugetele de achiziție a forței de muncă AI”. Companiile tradiționale de SaaS vând software standardizat, în timp ce furnizorii de servicii Agent din viitor vor oferi forță de muncă AI personalizabilă și actualizabilă, capabilă să acopere diverse funcții ale întreprinderilor precum HR, contabilitate, legal, operațiuni etc., iar dimensiunea pieței va fi mult mai mare decât cea a SaaS-ului tradițional.
Această transformare va conduce la polarizarea industriei: furnizorii de SaaS tradiționali care nu dispun de capacități de model AI și nu pot integra experiența din industrie cu tehnologia agentului se vor confrunta cu riscul de a fi înlocuiți; în timp ce cei care pot finaliza rapid tranziția AI, combinând înțelegerea profundă a industriei cu tehnologia agentului și optimizarea puterii de calcul, vor obține un spațiu de piață mai mare.
6.4 AI edge și implementările private devin noi arene de competiție
În prezent, avantajele centrale ale Nvidia sunt concentrate în piața puterii de calcul din centrele de date cloud, iar piața AI edge și implementările private devin noi direcții de creștere și domenii de competiție în industrie, reprezentând totodată provocări potențiale pentru Nvidia.
Aplicațiile AI la nivel de întreprindere din industriile tradiționale, influențate de reglementările de conformitate și confidențialitatea datelor, tind mai mult către implementări private și calcul edge. Companii precum Qualcomm, AMD, Broadcom și altele își desfășoară activitatea în domeniul AI edge, lansând chip-uri NPU și AI optimizate pentru edge; acest sector nu a format încă un monopol absolut, iar o dată ce intră într-o perioadă de creștere rapidă, va crea un nou peisaj competitiv.
La conferința GTC, Nvidia a lansat rapid Box-ul GGX pentru implementări edge și private, accelerându-și intrarea în acest sector. Se preconizează că în următorii 3-5 ani, AI-ul edge și implementările private vor deveni principala arenă de competiție în piața puterii de calcul AI, influențând semnificativ structura industriei.
VII. Avertismente de risc
Riscul ca aplicațiile AI să nu se desfășoare conform așteptărilor: suportul central pentru obiectivul de un trilion al Nvidia depinde de desfășurarea pe scară largă a agenților și aplicațiilor AI; dacă viteza de penetrare a aplicațiilor AI este mai lentă decât se preconizează, va duce la o încetinire a creșterii cererii de putere de calcul, afectând realizarea obiectivului de livrare a comenzilor;
Riscul ca expansiunea capacității lanțului de aprovizionare să nu fie conform așteptărilor: expansiunea capacității proceselor avansate de la TSMC și ambalare, capacitatea de stocare HBM, expansiunea infrastructurii centrelor de date, prezintă cicli rigizi și incertitudini; dacă viteza de expansiune a capacității lanțului de aprovizionare este mai lentă decât se preconizează, va restricționa direct livrările de chip-uri Nvidia și livrarea comenzilor;
Riscul intensificării competiției: Google, AMD, marii furnizori cloud și furnizorii de modele mari își desfășoară activitatea pentru a-și dezvolta chip-uri AI interne; dacă produsele concurenților obțin progrese tehnologice, vor reduce cota de piață a Nvidia, deteriorând structura competițională din industrie;
Riscul ca actualizarea tehnologică să nu fie conform așteptărilor: dacă arhitectura modelului mare suferă o schimbare radicală sau dacă direcția tehnologică a chip-urilor AI suferă ajustări majore, avantajul tehnologic și de produs existent al Nvidia va fi afectat, iar competitivitatea sa centrală va fi pusă în pericol;
Riscurile reglementărilor globale: reglementările de control al exporturilor și politicile antitrust asupra chip-urilor AI și industriei semiconductorilor se strâng în rândul principalelor economii globale, ceea ce poate avea un impact negativ asupra vânzărilor globale și dezvoltării tehnologice a Nvidia;
Riscurile fluctuațiilor economice globale: fluctuațiile economice globale vor duce la o reducere a cheltuielilor de capital ale întreprinderilor și ale furnizorilor cloud, scăzând cererea de achiziții de putere de calcul AI, având un impact negativ asupra volumului comenzilor pentru Nvidia.
VIII. Perspective industriale și prognoza tendințelor viitoare
8.1 Tendințe pe termen scurt (1-2 ani)
Structura strânsă a ofertei de putere de calcul va continua: constrângerile de capacitate în lanțul de aprovizionare semiconductori și construcția centrelor de date sunt greu de atenuat pe termen scurt, iar oferta de putere de calcul AI va rămâne strânsă până în 2026, iar prețurile chip-urilor și ale puterii de calcul vor rămâne ridicate;
Proporția cererii de inferență continuă să crească: costurile de inferență se vor ridica rapid peste 70% din costul total al puterii de calcul AI, chip-urile de inferență cu latență redusă și soluțiile de optimizare a inferenței vor deveni punctele centrale de dezvoltare și investiții în industrie;
Modelul de multi-fabricare al Nvidia s-a format oficial: Nvidia va trece treptat de la a fi exclusiv dependentă de TSMC, la un model de multi-fabricare „TSMC predominant, Samsung + Intel în sprijin”, pentru a ameliora constrângerile de capacitate și a asigura livrarea comenzilor;
Aplicațiile Agent intră în etapa de desfășurare pe scară largă: produsele Agent pentru utilizatori finali vor realiza o acoperire extinsă a utilizatorilor, desfășurarea agenților la nivel de întreprindere se va accelera rapid, devenind motorul principal al creșterii cererii de Token.
8.2 Tendințe pe termen mediu și lung (3-5 ani)
Puterea de calcul heterogenă devine standardul din industrie: sistemul de putere de calcul AI din viitor va forma o arhitectură mixtă heterogenă „GPU+LPU+CPU+interconexiune optică”, diferite arhitecturi de chip-uri adaptându-se la diferite scenarii de aplicație, iar modelul diversificat de putere de calcul este oficial format;
Ecosistemul Nvidia continuă să se extindă, iar poziția sa de lider rămâne stabilă: Nvidia va continua să-și consolideze poziția de operator de infrastructură AI, ecosistemul său complet se va extinde constant, chiar dacă cota de piață a scăzut, poziția sa de lider în industrie va rămâne greu de contestat;
Modelul AaaS înlocuiește treptat modelul SaaS tradițional: AaaS (Agent as a Service) va deveni modelul comercial principal pentru serviciile de întreprindere, iar piața serviciilor de întreprindere va suferi o restructurare completă, iar furnizorii cu experiență în industrie și capacități de optimizare a puterii de calcul vor deveni participanți centrali pe piață;
AI edge devine un nou punct de creștere: piața AI edge și implementările private vor intra într-o perioadă de explozie, devenind o nouă direcție de creștere în industria puterii de calcul AI și arena centrală de competiție în industrie;
Reconfigurarea lanțului de aprovizionare al semiconductorilor: furnizorii globali de semiconductori vor continua să extindă capacitățile de procesare avansate și ambalare, formând treptat un model de diversificare a lanțului de aprovizionare, reducând dependența de un singur furnizor sau de o singură regiune.

