Rakstījusi: Zhao Ying

Avots: Wall Street Jūtas

AI lietojumu komercializācija, kas pāriet no programmatūras un abonementu pārdošanas uz Token izsniegšanu. Šeit Token ir lielo modeļu apstrādāto informācijas minimālais vienības elements, kā arī modeļa API norēķinu, samaksas un patēriņa pamats. Pieaugot pieprasījumam, Token sāk izskatīties kā veids, kā «krājumi» tiek iepirkti, maršrutēti, dalīti un tālāk pārdoti.

Huayuan vērtspapīru analītiķis Chen Liangdong nesen publicētajā mediju nozares specializētajā ziņojumā apkopoja galvenās izmaiņas: «Token darbība veido jaunu starpnieku tirgu, kas pēta Token izplatīšanas modeļus, savienojot augšupejas lielo modeļu ražotājus ar apakšupejas izstrādātājiem, uzņēmumiem un indivīdiem, būtībā veidojot globālo Token vairumtirdzniecības un mazumtirdzniecības tīkla likviditātes infrastruktūru.»

Šī biznesa parādīšanās fons nav sarežģīts: no vienas puses, Ķīnas Token pieprasījuma apjoms strauji pieaug, 2024. gada sākumā dienas vidējais pieprasījums ir 1000 miljardi, līdz 2025. gada beigām tas pieaugs līdz 100 triljoniem, 2026. gada martā pārsniedzot 140 triljonus; no otras puses, mājas ražošanas lielo modeļu spējas kāpj, un dažos reitingos un pieprasījumos jau ir nonākušas pasaules pirmajā līmenī. Pieprasījums pieaug, modeļi pieaug, un faktiskais tirdzniecības bloķēšanas posms kļūst par maksājumiem, tīklu, saskarnēm, atbilstību, kanāliem un situāciju īstenošanu.

Bet Token izplatīšana nevar tikt vienkārši saprasta kā 'API limitu pārdot'. Visplānākā peļņa nāk no pārdošanas starpības, bet biezākā daļa nāk no izpildes paātrinājuma, vienota saskarne, uzņēmuma līmeņa Prompt inženierijas, aģentu organizēšanas, modeļu izvēles un biznesa sistēmu integrācijas. Tieši tāpēc, ka ieejas barjera nav augsta, šī tirgus riski ir tieši tādi paši: konkurences pieaugums, priekšfinansējums un sliktie parādi, augšējo modeļu piegādātāju politikas izmaiņas, visi samazina vidējā slāņa peļņu.

Token jau ir ieguvuši 'vairumtirgotājus' un 'mazumtirgotājus'.

Token izplatīšanas pamatķēde ietver trīs lomu kategorijas.

Augšupejošie ir modeļu puses, tostarp ByteDance Seedance sērija, Alibaba Qwen sērija, Zhiyu GLM sērija, Mēness tumšā puse Kimi sērija, DeepSeek sērija utt., tās ir Token avota piegādātājas.

Vidējais slānis ir aģentu platforma, kas atbild par augšējo modeļu resursu uzņemšanu un to izplatīšanu gala lietotājiem. Tās darbs nav tikai pārdot limitus, bet arī pārvērst dažādu modeļu saskarnes protokolus vienotā API formātā, ļaujot apakšējiem lietotājiem izsaukt vairākus modeļus ar vienu API atslēgu.

Apakšējie ir tie, kas faktiski patērē Token, tostarp individuālie lietotāji, izstrādātāji, uzņēmumu klienti, kā arī var ietvert apakšējo izplatītāju darbiniekus.

Šī vidējā slāņa vērtība koncentrējas vairākos punktos: vietējās tiešās saites samazina tīkla piekļuves barjeru; viens kods pielāgo vairākiem modeļiem; atbalsta individuālos un uzņēmumu maksājumus; iegādājoties apjomā, iespējams iegūt zemākas izmaksas; viena platforma apvieno GPT, Claude, DeepSeek, Kimi un citus dažādus modeļus, samazinot izstrādātāju atkārtotu piekļuves izmaksas.

Tādējādi, Token izplatīšana izskatās kā viegla aktīvu struktūra, nav nepieciešama paša liela modeļa apmācība vai plašas serveru klasteru izmantošana. Galvenie aktīvi pārvēršas par API pārsūtīšanas un plānošanas sistēmu, augšupejošo modeļu resursu, kanālu klientiem un pakalpojumu spējām.

Pieprasījuma pieaugums ir šī biznesa tiešais degviela.

Token darbības modelim ir jābūt pietiekami lielam patēriņa apjomam.

Ķīnas dienas vidējais Token pieprasījums divu gadu laikā ir pieaudzis no 1000 miljardiem līdz vairāk nekā 140 triljoniem, pieaugot par vairāk nekā tūkstoš reizēm. Pieprasījuma paplašināšanās ir saistīta ar dažādām vertikālām aģentūrām, kā arī uzņēmumiem, kas integrē ģeneratīvo AI vairākos biznesa procesos.

IDC dati sniedz agresīvāku ceļu: tiek prognozēts, ka Ķīnas uzņēmumu aktīvo inteliģento aģentu skaits 2031. gadā pārsniegs 350 miljonus, ar gada kompozīto izaugsmes tempu virs 135%; pieaugot inteliģento aģentu uzdevumu blīvumam un sarežģītībai, inteliģento aģentu Token patēriņa gada pieaugums varētu pārsniegt 30 reizes.

Izpildes inteliģentie aģenti jau var redzēt šīs izmaiņas. OpenClaw nedēļā Token patēriņš OpenRouter platformā no 2026. gada 2. februāra līdz 16. martam pieauga no 0.81T līdz 4.97T, proporcija palielinājās no 8.31% līdz 24.36%.

Kad Token kļūst par masveida patēriņa preci, ap to iepirkšana, cenas noteikšana, maršrutēšana un norēķini dabiski tiks sadalīti slāņos. Modeļu piegādātāji ne vienmēr tieši apkalpo katru klientu, un gala klienti ne vienmēr būs gatavi piekļūt modeļiem individuāli, tādēļ vidējā slāņa telpa ir radusies.

Vietējo modeļu izmaksu efektivitāte atver durvis Token izplatīšanai ārzemēs.

Mājas ražošanas lielo modeļu spēju palielināšana ir galvenais mainīgais faktors, lai Token izplatīšana no vietējā tirgus pāri robežām.

SuperCLUE dati rāda, ka ByteBean, DeepSeek sērija un citi vietējie modeļi ir pārsnieguši 70 punktus, un atšķirība ar GPT-5.4, Gemini un citiem starptautiskajiem augstākajiem modeļiem samazinās; Tongyi Qianwen, Kimi, Zhiyu GLM un citi modeļi arī veido skaidru līmeņu struktūru.

OpenRouter datos, līdz 2026. gada 10. maijam nedēļā, Tencent Hy3 preview (bez maksas) ieņem pieprasījuma apjoma pirmo vietu; starp pieciem, desmit un divdesmit labākajiem modeļiem vietējie lielie modeļi ir attiecīgi 2, 6 un 9.

Vēl izteiktākas izmaiņas notika 2026. gada pirmajā ceturksnī. No 9. līdz 15. februārim Ķīnas modeļu pieprasījums OpenRouter platformā sasniedza 41.2 triljonus Token, pirmo reizi pārsniedzot ASV modeļus ar 29.4 triljoniem Token. No 16. līdz 22. februārim Ķīnas modeļu nedēļas pieprasījums vēl vairāk pieauga līdz 51.6 triljoniem Token; platformas pieprasījumā pirmajās piecās modeļu pozīcijās četras bija no Ķīnas ražotājiem, proti, MiniMax M2.5, Kimi K2.5, Zhiyu GLM-5 un DeepSeek V3.2, kopā sniedzot 85.7% no Top5 kopējā pieprasījuma.

Cenu priekšrocības ir arī ļoti izteiktas. MiniMax M2.5 un GLM 5 ievades cena ir katram miljonam Token 0.3 dolāri, Claude Opus 4.6 ir 5 dolāri; izvades cenas ziņā MiniMax M2.5 ir 1.1 dolārs, GLM 5 ir 2.55 dolāri, Claude Opus 4.6 ir 25 dolāri. Vietējo modeļu cenas attiecībā uz AI aģentiem, koda izstrādi un citām augsta Token patēriņa situācijām turpina pieaugt.

Globālās AI resursu nevienlīdzība ir padarījusi maršrutēšanas platformas par 'pārsūtīšanas stacijām'.

Token izplatīšana ne tikai risina cenu jautājumus, bet arī risina resursu nepareizu sadalījumu.

Ārzemju augstākie lielie modeļi cieš no reģionālās piekļuves ierobežojumiem, atbilstības noteikumiem un maksājumu barjerām, nespējot tieši sasniegt daļu lietotāju, tostarp Ķīnas kontinentā esošos izstrādātājus. Vietējo kvalitatīvo lielo modeļu iekļūšana ārzemēs arī saskarsies ar lokalizācijas pielāgošanas, kanālu izveides un lietotāju piesaistes grūtībām.

Šī nelīdzsvarotība ir radījusi pieprasījumu pēc starptautiskas pārvietošanas, apvienošanas maršrutu un slāņveida izplatīšanas.

OpenRouter jau ir tipisks paraugs. Tās platformas Token apjoms ir palielinājies no 2025. gada 50-70 triljoniem līdz 2026. gada aprīlī pārsniedzot 200 triljonus; 2026. gada gada ieņēmumi pārsniedz 50 miljonus dolāru, salīdzinot ar 2025. gada oktobrī atklātajiem vairāk nekā 10 miljoniem dolāru gada ieņēmumiem pieaugot par apmēram piecām reizēm.

Vietējā tirgū ir līdzīgas platformas. Silīcija bāzes plūsma ir vienota lielo modeļu mākoņservisa platforma, kas balstīta uz pašu izstrādāto uzlabotu izpildes dzinēju, nodrošinot efektīvu izpildes paātrinājumu un uzņēmumu līmeņa lielo modeļu pakalpojumus. Līdz 2025. gada decembrim platformā ir reģistrēti vairāk nekā 9 miljoni lietotāju, vairāk nekā 10 000 uzņēmumu lietotāju, un ir ieviesti vairāk nekā 150 modeļi.

Pat ASV politiskie saistītie kapitāli ir ienākuši šajā tirgū. 2026. gada 5. maijā, saistībā ar Trampu un viņa ģimeni, kriptovalūtu uzņēmums WLFI sadarbībā ar WorldClaw izlaida WorldRouter, apvienojot Claude, GPT, Gemini un vairāk nekā 300 modeļus, norēķinoties USD1, un cena ir par aptuveni 30% zemāka nekā oficiālās publiskās cenas.

Patiesais peļņas avots nav obligāti 'pārdošanas starpība'.

Token izplatīšanai ir trīs peļņas veidi.

Pirmais veids ir pārdošanas starpība. Platforma masveidā iepērk API limitus no augšējiem modeļu piegādātājiem un pārdod tos apakšējiem klientiem ar uzcenojumu. OpenRouter piegādātāju izmaksām pievieno apmēram 5.5% uzcenojumu, kas ir šī modeļa pārstāvis.

Otrais veids ir tehnoloģiskā peļņa. Platforma, izmantojot pašu izstrādāto izpildes paātrinājuma dzinēju, samazina katra Token darbības izmaksas, un, kad cena ir tuvu vai pat zem oficiālās cenas, paļaujoties uz skaitļošanas efektivitātes atšķirībām, gūst bruto peļņu. Silīcija bāzes plūsmas SiliconLLM un OneDiff tehnoloģija palielina valodas modeļa izpildes ātrumu par 10 reizes, attēlu ražošanas efektivitāti par 3 reizes, samazinot lielo modeļu API izsaukuma izmaksas līdz nozares 1/10.

Trešais veids ir uzņēmumu pievienotās vērtības pakalpojumi. Uzņēmumu AI ieviešanas izmaksas nav tikai Token vienības cena, bet arī ietver Prompt inženieriju, vairāku modeļu izvēli, biznesa sistēmu integrāciju, darba plūsmu organizēšanu, uzturēšanu un darbinieku AI spēju attīstību. Pamatā esošā Token cena samazinoties, šie slēptie izmaksas var kļūt par maksājumu punktiem.

Silīcija bāzes plūsmas uzņēmuma līmeņa MaaS platforma ir šajā virzienā: tā piedāvā uzņēmumu lietotājiem modeļu apmācību, izvietošanu, pielāgošanu un lietojumprogrammu izstrādes atbalstu, aptverot datu apstrādi, modeļu pielāgošanu, Prompt inženieriju un RAG utt., gala rezultātā tiek piegādāta standartizētas API formā enerģētikas, finansu, valdības un citu nozaru vajadzībām.

Mārketinga, īssēriju, spēļu, e-komercijas jomas ir vieglākas Token patēriņa situācijas.

Token izplatīšana, lai gūtu peļņu, gal最终 jāsasniedz reālās situācijās.

Ģeneratīvā AI lietojumprogrammas iekļūst medicīnas, transporta, rūpniecības ražošanas un citās nozarēs, un tās sāk piedalīties uzņēmumu lēmumu pieņemšanas atbalstā, stratēģiskajā vadībā un citos būtiskos procesos. Bet daudziem uzņēmumiem inteliģentas transformācijas pamati ir vāji, datu aktīvu uzkrāšana ir nepietiekama, skaitļošanas ieguldījumi ir ierobežoti, tieši AI spēju ieviešana nav viegla.

Salīdzinājumā ar to, mārketinga reklāmas uzņēmumiem jau ir klienti un situācijas, kas saistītas ar īssērijām, komiksu sērijām, spēlēm, e-komerciju utt., Token patēriņa pieprasījums ir tiešāks un noturīgāks. Šiem uzņēmumiem iespēja nav tikai pārdot modeļu spējas, bet arī iekļaut Token klientu satura ģenerēšanā, izvietošanā, materiālu ražošanā, video procesā utt.

Investīciju pavedieni attīstās divos galvenajos virzienos:

Viens veids ir uzņēmumi ar kvalitatīvu modeļu spēju, tostarp Alibaba, Tencent Holdings, Kuaishou, Kunlun Wanwei, Zhiyu, MiniMax utt.

Otrs veids ir uzņēmumi ar spēcīgām Token situācijām un kvalitatīviem klientu avotiem, īpaši tie, kas ir ieguvuši ārzemju klientu resursus un mārketinga situācijas, kas ir gatavi aktīvi ieguldīt AI mārketingā un AI video virzīšanā, tostarp Yidian Tianxia, BlueFocus utt.

Riski ir arī ļoti stingri: zema piekļuve, nepieciešama priekšfinansēšana, augšupejošā puse nosaka.

Token izplatīšanas biznesa modelis ir viegls, bet aizsardzības mūris nav dabiski dziļš.

Nozares konkurence ir pirmais riska slānis. Izplatīšanas biznesa tehnoloģiskā barjera ir zema, un ja galvenie aģenti, izmantojot kapitāla, klientu un kanālu priekšrocības, iekļūst tirgū, viņi var ātri kopēt modeli un saspiest peļņas telpu.

Pirmsfinansējums un sliktie parādi ir otrais riska slānis. Izplatītāji bieži izmanto mēneša vai ceturkšņa norēķinus ar apakšējo klientu, taču, iepērkot API limitus no augšējo piegādātāju, ir jāveic priekšfinansējums. Jo lielāks Token patēriņš, jo lielāks priekšfinansējuma spiediens; ja klients kavē maksājumus, sliktā parāda risks palielinās.

Augšupejošo modeļu piegādātāju politikas maiņas ir trešais riska slānis. Lielo modeļu piegādātāji kontrolē API cenas un piekļuves noteikumus, var mainīt cenas vai ierobežot trešo pušu piekļuves politiku. Vidējā slāņa gadījumā tas ir visgrūtāk kontrolējams posms.