Bài viết này được tổng hợp từ ứng dụng nhỏ WeChat: Crypto Cloud Travel

Mùa hè năm 1858, một cáp điện đồng đi xuyên qua đáy đại dương Đại Tây Dương, kết nối London và New York.


Ý nghĩa của việc này không bao giờ nằm ở tốc độ truyền tải, mà nằm ở cấu trúc quyền lực, ai đã lắp đặt cáp quang dưới đáy biển, người đó có thể thu lợi từ dòng chảy thông tin. Đế quốc Anh đã dựa vào mạng lưới điện báo toàn cầu này để nắm giữ thông tin của thuộc địa, giá bông, thông tin chiến tranh.


Sự mạnh mẽ của đế quốc không chỉ đến từ hạm đội, mà còn từ cáp quang đó.


Hơn một trăm sáu mươi năm sau, logic này đang tái hiện theo một cách bất ngờ.


Năm 2026, các mô hình lớn của Trung Quốc đang âm thầm chiếm lĩnh thị trường phát triển toàn cầu. Dữ liệu mới nhất từ OpenRouter cho thấy, trong tiêu thụ Token của mười mô hình hàng đầu trên nền tảng, mô hình Trung Quốc chiếm 61%, ba mô hình đứng đầu đều đến từ Trung Quốc. Các nhà phát triển ở San Francisco, Berlin, Singapore mỗi ngày gửi đi các yêu cầu API, đang vượt qua cáp quang dưới đáy Thái Bình Dương đến trung tâm dữ liệu tại Trung Quốc, sức mạnh tính toán được tiêu thụ ở đó, điện lực đang lưu thông, và kết quả được trả về.


Điện lực chưa bao giờ rời khỏi mạng lưới điện Trung Quốc, nhưng giá trị của nó đã được chuyển giao xuyên biên giới thông qua Token.


Cuộc di cư lớn của mô hình AI


Ngày 24 tháng 2 năm 2026, OpenRouter đã công bố một bản dữ liệu hàng tuần: tổng tiêu thụ Token của mười mô hình hàng đầu trên nền tảng khoảng 8.7 triệu tỷ, mô hình Trung Quốc chiếm 5.3 triệu tỷ, chiếm 61%. MiniMax M2.5 đứng đầu với 2.45 triệu tỷ Token, Kimi K2.5, Zhizhi GLM-5 theo sau, ba mô hình đứng đầu đều đến từ Trung Quốc.


Dữ liệu mới nhất vào ngày 26 tháng 2


Đây không phải là ngẫu nhiên, một ngòi nổ đã châm ngòi cho mọi thứ.


Đầu năm nay, OpenClaw ra mắt, một công cụ mã nguồn mở thực sự bắt đầu 'làm việc' cho AI, có thể trực tiếp điều khiển máy tính, thực hiện lệnh, hoàn thành quy trình công việc phức tạp song song, số lượng sao trên GitHub đã vượt qua 210,000 chỉ trong vài tuần.


Nhà đầu tư tài chính John ngay lập tức cài đặt OpenClaw và kết nối với API của Anthropic, bắt đầu tự động theo dõi thông tin thị trường chứng khoán và kịp thời báo cáo tín hiệu giao dịch, vài giờ sau, anh ta nhìn vào số dư tài khoản và ngẩn người mấy giây: vài chục đô la, đã hết.


Đây là thực tế mới mà OpenClaw mang lại. Trước đây khi trò chuyện với AI, một cuộc trò chuyện chỉ tiêu tốn vài nghìn Token, chi phí không đáng kể. Sau khi OpenClaw được kết nối, AI chạy đồng thời hàng chục nhiệm vụ con trong nền, gọi lại ngữ cảnh, lặp đi lặp lại, chi phí Token không phải là tuyến tính, mà là cấp số nhân. Hóa đơn giống như một chiếc xe đang tăng tốc với nắp động cơ mở, chỉ số nhiên liệu giảm xuống, không dừng lại được.


Trong cộng đồng nhà phát triển, một 'mẹo' ngay lập tức lan truyền: sử dụng token OAuth để kết nối tài khoản thuê bao của Anthropic hoặc Google trực tiếp vào OpenClaw, biến hạn mức 'vô hạn' theo tháng thành nhiên liệu miễn phí cho AI Agent, đây cũng là phương pháp mà nhiều nhà phát triển áp dụng.


Phản công chính thức ngay lập tức đến.


Anthropic đã cập nhật quy định vào ngày 19 tháng 2, rõ ràng cấm sử dụng chứng nhận thuê bao Claude cho các công cụ bên thứ ba như OpenClaw, để kết nối tính năng Claude, phải đi qua kênh tính phí API. Google thậm chí còn cấm rộng rãi các tài khoản thuê bao kết nối Antigravity và Gemini AI Ultra thông qua OpenClaw.


‘Thiên hạ khổ Qin đã lâu’, John ngay lập tức đã lao vào lòng của các mô hình lớn nội địa.


Trên OpenRouter, mô hình lớn nội địa MiniMax M2.5 về điểm số trong các nhiệm vụ kỹ thuật phần mềm là 80.2%, Claude Opus 4.6 là 80.8%, sự chênh lệch gần như có thể bỏ qua. Nhưng giá cả thì chênh lệch lớn, đầu vào của mô hình trước là 0.3 đô la cho mỗi triệu Token, trong khi mô hình sau là 5 đô la, chênh lệch khoảng 17 lần.


John đã chuyển qua, quy trình làm việc vẫn tiếp tục, hóa đơn đã giảm một bậc, cuộc di cư này đang xảy ra đồng bộ trên toàn cầu.


Chris Clark, COO của OpenRouter, đã nói rất thẳng thắn, lý do các mô hình mã nguồn mở của Trung Quốc có thể giành được nhiều thị phần là vì chúng chiếm tỷ lệ bất thường cao trong quy trình làm việc của các nhà phát triển Mỹ.


Điện lực xuất khẩu


Để hiểu bản chất của việc Token xuất khẩu, trước hết phải làm rõ cấu trúc chi phí của một Token.


Nó trông nhẹ nhàng, một Token khoảng bằng 0.75 từ tiếng Anh, cuộc trò chuyện bình thường của bạn với AI cũng chỉ tiêu tốn vài nghìn Token. Nhưng khi những Token này xếp chồng lên nhau theo đơn vị nghìn tỷ, thực tế vật lý đứng sau trở nên nặng nề.


Phân tích chi phí của Token, cốt lõi chỉ có hai yếu tố: sức mạnh tính toán và điện lực.


Sức mạnh tính toán là chi phí khấu hao GPU, bạn mua một chiếc Nvidia H100, mất khoảng ba mươi ngàn đô la, tuổi thọ của nó được tính ra cho mỗi lần suy luận là chi phí khấu hao. Điện lực là nhiên liệu cho trung tâm dữ liệu vận hành liên tục, GPU khi hoạt động tối đa tiêu tốn khoảng 700 watt, cộng với chi phí của hệ thống làm mát, hóa đơn điện của một trung tâm dữ liệu AI lớn có thể dễ dàng vượt quá hàng trăm triệu đô la mỗi năm.


Bây giờ, hãy vẽ quá trình vật lý này trên bản đồ.


Một nhà phát triển Mỹ ở San Francisco gửi đi một yêu cầu API. Dữ liệu xuất phát từ California, vượt qua cáp quang dưới đáy Thái Bình Dương đến một trung tâm dữ liệu nào đó ở Trung Quốc, cụm GPU bắt đầu hoạt động, điện từ lưới điện Trung Quốc chảy đến những con chip đó, suy luận hoàn thành, kết quả được trả về. Toàn bộ quá trình có thể chỉ mất một hai giây.


Điện lực chưa bao giờ rời khỏi lưới điện Trung Quốc, nhưng giá trị của điện lực, thông qua Token, đã hoàn tất việc giao hàng xuyên biên giới.


Ở đây có một điều kỳ diệu mà thương mại thông thường không thể với tới: Token không có hình thể, không cần phải qua hải quan, không bị đánh thuế, thậm chí không nằm trong bất kỳ số liệu thống kê thương mại hiện hành nào. Trung Quốc đã xuất khẩu một lượng lớn dịch vụ sức mạnh tính toán và điện, nhưng trong dữ liệu thương mại hàng hóa chính thức, gần như nó vô hình.


Token đã trở thành sản phẩm phái sinh của điện lực, bản chất của việc Token xuất khẩu là điện lực xuất khẩu.


Điều này cũng nhờ vào giá điện tương đối thấp ở Trung Quốc, giá điện tổng hợp thấp hơn khoảng 40% so với Mỹ, đây là sự chênh lệch về chi phí vật lý mà đối thủ có thể dễ dàng sao chép.


Ngoài ra, các mô hình AI lớn của Trung Quốc cũng có lợi thế về thuật toán và 'nội bộ'.


Cấu trúc MoE của DeepSeek V3 cho phép chỉ kích hoạt một phần tham số trong quá trình suy luận, các thử nghiệm độc lập cho thấy chi phí suy luận của nó thấp hơn khoảng 36 lần so với GPT-4o, MiniMax M2.5 cũng chỉ có 229B tham số tổng cộng nhưng chỉ kích hoạt 10B.


Tầng trên cùng là nội bộ, Alibaba, ByteDance, Baidu, Tencent, Mặt trăng tối, Zhizhi, MiniMax... mười mấy công ty đang chạy đua trên cùng một đường đua, giá cả đã rơi xuống dưới khu vực lợi nhuận hợp lý, việc lỗ vốn kiếm tiếng đã trở thành điều bình thường trong ngành.


Xem kỹ một chút, điều này giống như việc sản xuất của Trung Quốc xuất khẩu, sử dụng lợi thế chuỗi cung ứng và sự nội bộ trong ngành, đẩy giá Token xuống một cách mạnh mẽ.


Từ Bitcoin đến Token


Trước Token, đã có một lần điện lực xuất khẩu.


Khoảng năm 2015, các quản lý nhà máy điện ở Tứ Xuyên, Vân Nam và Tân Cương bắt đầu tiếp đón một số khách hàng kỳ lạ.


Những người này thuê những nhà máy bỏ hoang, lắp đặt hàng trăm máy móc, hoạt động 24 giờ một ngày. Máy móc không sản xuất gì cả, chỉ liên tục giải một bài toán toán học, đôi khi, từ bài toán vô tận này, tính ra một đồng Bitcoin.


Đây là hình thái đầu tiên của điện lực xuất khẩu: biến điện thủy điện và điện gió giá rẻ, thông qua tính toán băm của máy khai thác, thành tài sản kỹ thuật số lưu thông toàn cầu, và sau đó chuyển đổi thành đô la trên sàn giao dịch.


Điện lực không vượt qua bất kỳ biên giới nào, nhưng giá trị của điện lực, thông qua Bitcoin, đã chảy vào thị trường toàn cầu.


Trong những năm đó, sức mạnh tính toán của Trung Quốc từng chiếm hơn 70% sức mạnh khai thác Bitcoin toàn cầu. Điện thủy điện và điện than của Trung Quốc, theo cách này, tham gia vào một cuộc tái phân phối vốn toàn cầu.


Năm 2021, mọi thứ dừng lại đột ngột. Cú đập của quy định đã xảy ra, các thợ mỏ tản ra, sức mạnh tính toán đã di chuyển đến Kazakhstan, Texas, Mỹ và Canada.


Nhưng logic này bản thân nó chưa bao giờ biến mất, chỉ đang chờ đợi một lớp vỏ mới, cho đến khi ChatGPT xuất hiện, các mô hình lớn tranh giành, những mỏ Bitcoin trước đây đã biến hình thành trung tâm dữ liệu AI, máy khai thác trở thành GPU tính toán, Bitcoin trước đây sản xuất ra đã trở thành Token, chỉ có điện lực là không thay đổi.


Việc Bitcoin xuất khẩu và Token xuất khẩu, về mặt logic cơ bản là đồng nhất, nhưng Token hiện tại có giá trị thương mại hơn.


Khai thác Bitcoin là một phép toán thuần túy, sản phẩm ra là một loại tài sản tài chính, giá trị của nó đến từ sự khan hiếm và sự đồng thuận của thị trường, không liên quan gì đến ‘đã tính toán cái gì’. Sức mạnh tính toán bản thân không có tính sản xuất, mà giống như một sản phẩm phụ của cơ chế tin tưởng.


Suy luận mô hình lớn thì khác. GPU tiêu tốn điện, sản phẩm tạo ra là dịch vụ nhận thức thực sự, mã, phân tích, dịch thuật, sáng tạo. Giá trị của Token trực tiếp đến từ hiệu dụng của nó đối với người sử dụng. Đây là một sự nhúng sâu hơn, một khi quy trình làm việc của nhà phát triển phụ thuộc vào một mô hình nào đó, chi phí chuyển đổi sẽ tăng cao theo thời gian.


Tất nhiên, còn một sự khác biệt quan trọng: khai thác Bitcoin đã bị Trung Quốc tẩy chay, trong khi việc Token xuất khẩu là lựa chọn chủ động của các nhà phát triển toàn cầu.


Cuộc chiến Token


Cáp quang dưới đáy đại dương được lắp đặt vào năm 1858, đại diện cho chủ quyền của Đế quốc Anh đối với cao tốc thông tin, ai sở hữu cơ sở hạ tầng, người đó có thể định nghĩa quy tắc trò chơi.


Token xuất khẩu, cũng là một cuộc chiến không cần tuyên chiến, với nhiều trở ngại.


Chủ quyền dữ liệu là bức tường đầu tiên, một yêu cầu API của nhà phát triển Mỹ được xử lý qua trung tâm dữ liệu Trung Quốc, dữ liệu vật lý đã đi qua Trung Quốc. Đối với các nhà phát triển cá nhân và ứng dụng nhỏ, đây không phải là vấn đề, nhưng khi liên quan đến dữ liệu nhạy cảm của doanh nghiệp, thông tin tài chính, và các tình huống tuân thủ chính phủ, đây là một điểm yếu nghiêm trọng. Đây cũng là lý do tại sao tỷ lệ thâm nhập của mô hình Trung Quốc cao nhất trong công cụ phát triển và lĩnh vực ứng dụng cá nhân, gần như không có sự hiện diện trong các hệ thống cốt lõi của doanh nghiệp.


Lệnh cấm chip là bức tường thứ hai, sự phát triển AI của Trung Quốc đang đối mặt với việc kiểm soát xuất khẩu GPU cao cấp của Nvidia, cấu trúc MoE và tối ưu hóa thuật toán chỉ có thể một phần nào đó bù đắp cho bất lợi này, trần vẫn còn tồn tại.


Nhưng cản trở trước mắt chỉ là chương đầu, một chiến trường lớn hơn đang hình thành.


Token và mô hình AI đã trở thành một chiều cạnh chiến lược mới giữa Trung Quốc và Mỹ, không kém gì so với bán dẫn, internet của thế kỷ 20, thậm chí gần giống như một phép ẩn dụ cổ xưa hơn: cuộc đua không gian.


Năm 1957, Liên Xô phóng vệ tinh Sputnik 1, nước Mỹ chấn động, ngay lập tức khởi động chương trình Apollo, đổ vào hàng nghìn tỷ đô la tài nguyên ngày nay, quyết không để thua trong cuộc đua không gian.


Logic của cuộc đua AI tương tự đến kinh ngạc, nhưng mức độ kịch liệt sẽ vượt xa cuộc đua không gian. Cuộc đua không gian rốt cuộc là không gian vật lý, người bình thường không thể cảm nhận được, AI thâm nhập vào các mao mạch kinh tế, mỗi dòng mã, mỗi hợp đồng, mỗi hệ thống quyết định chính phủ đều có thể chạy một mô hình lớn của một quốc gia nào đó. Mô hình nào trở thành lựa chọn mặc định của hạ tầng cho các nhà phát triển toàn cầu, thì quốc gia đó sẽ vô hình có được sức ảnh hưởng cấu trúc đối với nền kinh tế số toàn cầu.


Đây chính là điều khiến Washington thực sự cảm thấy bất an về việc Token của Trung Quốc xuất khẩu.


Khi một kho mã của nhà phát triển, quy trình làm việc của Agent, và logic sản phẩm đều xoay quanh API của một mô hình Trung Quốc, chi phí chuyển đổi sẽ tăng theo cấp số nhân theo thời gian. Đến lúc đó, ngay cả khi Mỹ có luật hạn chế, các nhà phát triển cũng sẽ phản kháng bằng cách bỏ đi, giống như hôm nay không lập trình viên nào có thể từ bỏ GitHub.


Việc Token xuất khẩu ngày nay, có lẽ chỉ là khởi đầu của một cuộc chiến dài.


Lần này, những người lắp cáp quang là các đội ngũ kỹ sư đang viết mã ở Hàng Châu, Bắc Kinh, Thượng Hải, và những cụm GPU đang hoạt động suốt ngày đêm ở một tỉnh phía Nam.


Cuộc đua này không có đếm ngược, nó diễn ra 24 giờ mỗi ngày, đơn vị là Token, chiến trường là mỗi thiết bị đầu cuối của nhà phát triển.