Người sáng lập Twitter Jack Dorsey đang bắt tay vào xây dựng TBD — — một lớp danh tính và tin cậy của internet hoàn toàn mới, là nỗ lực đầu tiên của ông trong lĩnh vực tiền điện tử, nhằm hoạt động hoàn toàn dựa trên kiến trúc điểm đến điểm và kết hợp với các dịch vụ Web2 hiện có.
Nhiều người cho rằng TBD nghe có vẻ giống như dịch vụ nhận dạng phi tập trung của Web3 ENS, nhưng Dorsey không nghĩ như vậy. Là một tín đồ Bitcoin kiên định (ngày nay từ này đã trở thành biểu tượng cho những người hoài nghi tiền điện tử), ông thấy cần thiết phải phân biệt với dòng chính, đảm bảo rằng TBD sẽ không bao giờ được coi là một dự án Web3 khác.
Cụ thể, Dorsey nhận ra rằng Web3 — — một tầm nhìn internet phi tập trung xây dựng trên các giao thức mở và blockchain, bao gồm nhiều lớp danh tính, tài chính và xã hội — — không phải là hệ thống mà ông theo đuổi.
Ông nhận ra rằng thực tế của Web3 và tầm nhìn của nó có sự đối lập cơ bản: nó không tương thích với cơ sở hạ tầng hiện có của internet và cam kết hoàn toàn thay thế nó.

Định nghĩa của Web5 (Nguồn: TBD PPT)
Vì mục tiêu cốt lõi mà TBD tuyên bố là “phi tập trung” và không bao giờ thỏa hiệp, Dorsey đã chọn xây dựng hệ thống này trên Bitcoin. Theo ông, chỉ với điều này đã đủ để khiến TBD “không thuộc về Web3”, do đó cần tạo ra một thuật ngữ mới cho các hệ thống như vậy.
Để làm điều này, Dorsey đã nửa đùa nửa thật đề xuất thuật ngữ “Web5”, vừa là sự chế nhạo Web3, vừa là sự tôn vinh HTML5. HTML5 là nền tảng của internet ngày nay và là nỗ lực công nghệ lớn cuối cùng thúc đẩy sự tiến hóa của web cách đây 15 năm.

Từ tài liệu trắng của TBD, Dorsey coi Web5 là một mạng điểm đến điểm dựa trên Bitcoin làm lớp đồng thuận cơ bản và Lightning Network làm mạng thanh toán. Nó xoay quanh ba trụ cột: 1) Định danh phi tập trung mà người dùng sở hữu, 2) Chứng chỉ có thể xác thực, và 3) Các nút mạng phi tập trung để lưu trữ dữ liệu và chuyển tiếp tin nhắn.
“Trong mạng lưới ngày nay, danh tính và dữ liệu cá nhân đã trở thành tài sản của bên thứ ba. Web5 sẽ mang lại danh tính phi tập trung và lưu trữ dữ liệu cho ứng dụng của bạn. Nó cho phép các nhà phát triển tập trung vào việc tạo ra trải nghiệm người dùng tuyệt vời, đồng thời trả lại quyền sở hữu dữ liệu và danh tính cho cá nhân.” Trang web chính thức của TBD đã viết như vậy.
Kết hợp các tài liệu Twitter (một loạt tài liệu nội bộ, tiết lộ cách Twitter buộc phải kiểm duyệt nội dung nhạy cảm) với mục tiêu của TBD, chúng tôi có lý do để tin rằng, Dorsey thực chất muốn xây dựng “công nghệ tự do”.
Tầm nhìn của ông về công nghệ này được thể hiện điển hình trong Nostr — — một giao thức truyền tải tin nhắn phi tập trung và kháng kiểm duyệt, được thiết kế để giải quyết các vấn đề kiểm duyệt nội dung của các nền tảng truyền thông xã hội tập trung hiện tại.
Đối với những người mới, cách hoạt động của Nostr tương tự như blockchain: mỗi người dùng tạo ra một khóa riêng (cần giữ bí mật) và sử dụng khóa công khai của mình làm định danh. Tất cả các tin nhắn (được gọi là “ghi chép”) đều được người tạo ra mã hóa và ký kết, và có thể được người khác xác thực.
Nostr không phụ thuộc vào một nền tảng duy nhất để lưu trữ dữ liệu người dùng, mà thay vào đó sử dụng các máy chủ hoạt động độc lập (được gọi là “relay”) để lưu trữ và chuyển tiếp tin nhắn theo các quy tắc đơn giản, mở. Vì người dùng có thể chọn bất kỳ relay nào hoặc tự xây dựng nút của mình, không có quyền lực trung ương nào có thể kiểm duyệt hoặc xóa nội dung một cách hiệu quả. Giao thức này rất đơn giản, chỉ định nghĩa định dạng tin nhắn, chữ ký và cách phát hành, cho phép các nhà phát triển xây dựng thêm các chức năng như nhắn tin riêng, hỗ trợ hình ảnh, v.v.
Sau khi chứng kiến cách thức hoạt động của các công ty truyền thông xã hội tập trung, Dorsey bắt đầu mê mẩn một tầm nhìn khác: trả lại quyền kiểm soát ứng dụng mạng từ các doanh nghiệp và các nút dễ bị thao túng cho người dùng. Sự quan tâm và ủng hộ của ông đối với Nostr cho thấy, chúng ta có cơ hội vượt qua “quyền sở hữu máy chủ” của Web2, điều đáng lo ngại là mô hình này đã thâm nhập vào Web3.
Giờ đây, mặc dù chúng tôi không biết Dorsey có ý định châm biếm khi tạo ra thuật ngữ “Web5” hay không, nhưng có thể chắc chắn rằng ông đã nắm bắt được một số điều quan trọng. Mặc dù TBD chưa bao giờ phát hành sản phẩm và đã ngừng hoạt động, nhưng cái nhìn của Dorsey về những thiếu sót của Web3 vẫn chính xác và đầy dự đoán.
Tuy nhiên, tầm nhìn về Web5 của ông không nhất thiết phải giới hạn trong Bitcoin và Lightning Network.
Theo quan điểm của chúng tôi, ý nghĩa của Web5 vượt xa các thành phần của nó, không chỉ đơn thuần là một “mạng điểm đến điểm” dành riêng cho đồng thuận Bitcoin hoặc một khuôn khổ xây dựng xung quanh định danh phi tập trung.
Hơn nữa, Web5 không phải là một “đổi thương hiệu” có ý nghĩa ngữ nghĩa hay một chiến lược tiếp thị gây sốc, mà là một bước chuyển mình thực sự cho ngành công nghiệp internet trở về với nguồn gốc của nó.
Web5 trong mắt chúng tôi là một cấu trúc mạng lưới được tạo thành từ các mạng điểm đến điểm, kết nối các lớp đồng thuận PoW (bằng chứng công việc) và UTXO, mạng kênh và các hệ thống khác chưa được hình dung.

Cấu trúc topo mạng của sự phi tập trung và mạng điểm đến điểm (Nguồn: CKB Eco Fund)
Cấu trúc nền tảng là sự khác biệt cốt lõi giữa Web5 và Web3.
Web5 được xây dựng trên một mạng lưới thực sự phi tập trung, có cấu trúc topo điểm đến điểm, đây là kết quả trực tiếp của việc áp dụng đồng thuận PoW và mô hình UTXO. Nó không coi công nghệ blockchain là cốt lõi duy nhất, mà hình dung một loạt các giao thức internet mở, được tăng cường thông qua các nguyên tố mật mã mới nhất, cùng nhau thúc đẩy internet bước vào kỷ nguyên mới.
Ngược lại, Web3 đã không thực hiện được cam kết về sự phi tập trung, kháng kiểm duyệt, không cần sự cho phép cũng như tự quản lý dữ liệu và tài sản, nguyên nhân nằm ở những thiếu sót của kiến trúc nền tảng, đặc biệt là quyết định chọn PoS (bằng chứng cổ phần) và mô hình Account.
Tình hình hiện tại của Web3
Web3 ngày nay là một tập hợp của vô số mạng “được coi là phi tập trung”. Kể từ khi MetaMask và Infura nổi lên vào năm 2017, những mạng này đã nhanh chóng chuyển sang cấu trúc topo khách hàng-máy chủ.
Mặc dù đã thực hiện những nỗ lực nghiên cứu và kỹ thuật khó khăn, chúng tôi kết luận rằng kết quả này là sản phẩm tất yếu được xây dựng trên mô hình PoS và Account.
Mặc dù chúng tôi tôn trọng nỗ lực nguyên tắc của nhiều người trong việc chống lại xu hướng này, nhưng chúng tôi không nghĩ rằng những thiếu sót trong cấu trúc topo khách hàng-máy chủ có thể được sửa chữa. Trước khi phân tích sâu nguyên nhân, hãy cùng xem xét tình hình hiện tại của Web3.
Vào tháng 2 năm 2009, Satoshi đã viết trong một bài đăng: “Vấn đề cơ bản của tiền tệ truyền thống nằm ở sự tin tưởng cần thiết cho sự vận hành của nó.”
Nhìn vào Ethereum ngày nay, “niềm tin” dường như không giảm đi. Mặc dù các nhà điều hành bể ký gửi và các nhà xây dựng khối không phải là bên thứ ba đáng tin cậy theo nghĩa nghiêm ngặt (TTP), nhưng họ rõ ràng đã trở thành những vai trò đặc quyền ngày càng quan trọng.
Tỷ lệ ETH mà các thực thể đã ký gửi chiếm tổng số ký gửi (Nguồn: dune.com)
Giao thức Staking thanh khoản Lido kiểm soát khoảng 28% tổng số ETH đã ký gửi, Coinbase kiểm soát khoảng 11%, điều này dấy lên lo ngại về quyền kiểm soát quản trị và quyền xác thực tập trung vào một số gã khổng lồ trong ngành. Beaverbuild và Titan Builder sản xuất khoảng 89% khối của Ethereum, càng làm tăng thêm lo ngại về khả năng kháng kiểm duyệt và kiểm soát giá trị có thể trích xuất tối đa (MEV).
Hơn nữa, mặc dù lớp nền Ethereum được coi là “đủ phi tập trung” trên nhiều chỉ số — — đặc biệt là so với hầu hết các dự án Web3 — — nhưng con đường mở rộng theo chiều ngang mà cộng đồng lựa chọn đã tạo ra các hệ thống phụ thuộc rõ ràng vào giả định tin cậy.

Các hệ thống này phụ thuộc vào các nhà cung cấp cơ sở hạ tầng tập trung hoạt động như “máy chủ”, trong khi người dùng trở thành “khách hàng” phụ thuộc vào những máy chủ này để có được chức năng mạng và quyền truy cập. Kiến trúc này không khác gì Web2 truyền thống, đi ngược lại mục tiêu phi tập trung ban đầu của Web3.

Lấy Rollup làm ví dụ, sự phụ thuộc vào bộ sắp xếp tập trung gây ra tắc nghẽn nghiêm trọng. Trong điều kiện lý tưởng, một thực thể duy nhất hoàn toàn kiểm soát việc sắp xếp và đóng gói giao dịch, người dùng buộc phải tin tưởng vào hành vi trung thực của nó — — điều này đi ngược lại với nguyên tắc “không cần tin cậy” của tiền điện tử. Trong điều kiện tồi tệ nhất, thực thể đó có thể hoàn toàn dừng hoạt động của chuỗi, như dự án Layer 2 Ethereum Linea đã tạm dừng bộ sắp xếp của mình vào năm nay sau khi một sàn giao dịch phi tập trung nào đó trong hệ sinh thái bị tấn công.
Tệ hơn nữa, Linea không phải là trường hợp ngoại lệ. Hầu hết các Rollup của Ethereum đều hoạt động tập trung, các nhà vận hành có thể kiểm duyệt giao dịch hoặc ngừng hoạt động của chuỗi vô thời hạn. Nếu một chuỗi có thể bị tạm dừng tùy ý, thì ý nghĩa của nó là gì? Rõ ràng là cơ sở dữ liệu tập trung truyền thống hoạt động tốt hơn, tại sao lại cần vận hành một chuỗi?
Ngay cả khi chúng ta phớt lờ những rủi ro này và ngây thơ giả định rằng các bên thứ ba đáng tin cậy trong cơ sở hạ tầng Web3 hiện tại là đáng tin cậy, chúng ta vẫn không thể tránh khỏi một thực tế: như Nick Szabo đã chỉ ra nhiều năm trước, những bên thứ ba này về bản chất là lỗ hổng an ninh, và vô số sự cố an ninh đã lặp đi lặp lại xác nhận điều này.
Ví dụ, vào tháng 7 năm 2023, giao thức đa chuỗi Multichain đã mất hơn 125 triệu USD do nghi ngờ nhân viên nội bộ lừa đảo. Lỗ hổng bắt nguồn từ việc Giám đốc điều hành Zhao Jun kiểm soát phần lớn khóa tính toán đa bên (MPC) của nền tảng, và ông đã bị cảnh sát Trung Quốc bắt giữ. Một năm trước, Ronin Bridge của Axie Infinity cũng đã gặp phải tình huống tương tự, khi nhóm hacker Bắc Triều Tiên Lazarus đã đánh cắp hơn 600 triệu USD tài sản của người dùng bằng cách kiểm soát 5/9 khóa xác thực.

Ngoài các vấn đề về niềm tin và an ninh, việc mở rộng theo chiều ngang (tức là phân tách giao dịch qua các chuỗi bên) đã dẫn đến các vấn đề nghiêm trọng về phân mảnh thanh khoản và chi phí cơ sở hạ tầng. Hiện có hàng chục Layer 2 của Ethereum, hầu hết trong số đó đã trở thành chuỗi ma do không thể thu hút đủ thanh khoản.

Tổng TVL của hai dự án Layer 2 hàng đầu Arbitrum và Base (32.12 tỷ USD) vượt quá tổng TVL của 18 dự án Layer 2 còn lại (11.43 tỷ USD). (Nguồn: L2Beat.com)
Tính thanh khoản thu hút các nhà giao dịch, khối lượng giao dịch tạo ra thanh khoản, và sự kết hợp của cả hai thu hút các nhà phát triển dApp. Tính thanh khoản phân mảnh khiến Layer 2 mắc kẹt trong tình huống hiệu ứng mạng: chuỗi đầu tiên vượt qua ngưỡng sẽ tiếp tục phát triển, trong khi các chuỗi còn lại dần dần suy tàn, dẫn đến việc thanh khoản và hoạt động người dùng tập trung vào một số ít người thắng cuộc.
Mặc dù những hệ thống này được gọi là Rollup, nhưng chúng vẫn là các blockchain có không gian khối khan hiếm. Điều này có nghĩa là Layer 2 thành công vẫn sẽ gặp phải các vấn đề về khả năng mở rộng và biến động phí tương tự như chuỗi gốc, dẫn đến nhu cầu Layer 3 với giả định an ninh phức tạp hơn.
Số lượng chuỗi tăng lên đồng nghĩa với chi phí cơ sở hạ tầng cao hơn — — vì cuối cùng ai đó cũng cần duy trì tất cả các Rollup. Ngay cả khi việc nâng cấp Ethereum EIP-4844 giới thiệu các khối dữ liệu (blob) và giảm chi phí khả dụng dữ liệu (DA) Layer 1 xuống 100 lần, chi phí hàng tháng để vận hành một Rollup vẫn lên tới 10,000 đến 16,000 USD (giả sử 2 triệu giao dịch mỗi tháng).
Dưới cùng một giả định, chi phí chỉ riêng Layer 1 đã đạt 25,000 USD, trong khi chi phí sử dụng các lớp DA thay thế như Celestia hoặc EigenDA rẻ hơn một vài bậc. Thật không may, đối với nhiều Layer 2, phí giao dịch mà người dùng trả không đủ để trang trải chi phí cơ sở hạ tầng, điều này có nghĩa là các nhà điều hành “máy chủ” phải tự gánh chịu chi phí. Gánh nặng tài chính này đẩy cao rào cản tham gia cho các đối tượng mới, tạo thế mạnh cho các thực thể có nguồn lực dồi dào, từ đó gia tăng sự tập trung.
Ngược lại, chuỗi PoW+UTXO mở rộng quy mô thông qua mở rộng dọc (thêm kênh thanh toán hoặc kênh trạng thái trên lớp nền). Việc xác thực giữ chi phí thấp và dễ dàng tiếp cận, người dùng có thể vận hành nút đầy đủ hoặc khách hàng nhẹ trên phần cứng thông thường, đảm bảo sự tham gia rộng rãi của mạng. Qua UTXO, người dùng quản lý trạng thái, chỉ cần xác thực các giao dịch liên quan đến bản thân mà không cần phụ thuộc vào trung gian tập trung.
Các giao thức như Lightning Network, Ark và RGB++ là những điển hình cho con đường này. Người dùng có thể thiết lập kênh thanh toán trực tiếp, tính bảo mật được neo vào đồng thuận PoW của lớp nền. Không cần cầu nối đa chuỗi, không cần các bộ sắp xếp tập trung có thể trở thành điểm lỗi, điều này giữ cho cấu trúc topo điểm đến điểm của mạng, đảm bảo sự phi tập trung thực sự và khả năng kháng kiểm duyệt.
Web3 đã đi đến bước này như thế nào?
Để hiểu tại sao chúng tôi xây dựng Web5, cần làm rõ Web3 đã sai ở đâu. Cách tốt nhất là xem xét các lựa chọn thiết kế trong lịch sử của Ethereum.
Trước hết, chúng tôi phải làm rõ rằng chúng tôi không có thành kiến với Ethereum (hay bất kỳ chuỗi nào khác). Thay vào đó, chúng tôi chỉ phân tích PoS + Account như một ví dụ về những thiếu sót của nó.
Trong danh mục này, Ethereum là chuỗi phi tập trung nhất về công nghệ, ý tưởng và cộng đồng, cũng là nguồn gốc và nền tảng xây dựng chính của câu chuyện Web3. Nếu lấy các chuỗi khác làm ví dụ để chỉ trích Web3, rõ ràng là không công bằng. Hơn nữa, chúng tôi tin rằng nỗ lực của cộng đồng Ethereum để đạt được mục tiêu Web3 là chân thành, và thất bại xuất phát từ quyết định cách đây mười năm.
Lỗi đầu tiên của Ethereum
Lỗi đầu tiên của Ethereum đến từ việc nó cố gắng biến blockchain thành “máy tính thế giới”. Trong bài viết này, chúng tôi giải thích sâu về lý do tại sao điều này về cơ bản là một ý tưởng tồi tệ, vì vậy chúng tôi chỉ đưa ra kết luận ở đây: blockchain được sử dụng để xác thực, không phải để tính toán.
Khi nhà phát triển Bitcoin Gregory Maxwell chỉ ra điều này hơn chín năm trước, Vitalik Buterin đã phản bác mạnh mẽ.
Nhìn vào tình hình hiện tại của Ethereum, có vẻ như lập luận “mọi thứ đều lên chuỗi” đã bị từ bỏ. Tất cả các nỗ lực mở rộng máy tính thế giới đều thông qua “mở rộng trên một chuỗi khác”, tức là lộ trình được biết đến nhiều hơn là Rollup-centric.
Nói cách khác, cộng đồng Ethereum đã từ bỏ các ý tưởng ban đầu, chuyển sang con đường “chuỗi blockchain mô-đun” bảo thủ hơn về mặt công nghệ. Ngày nay, lớp nền được sử dụng để xác thực và thanh toán cuối cùng, trong khi các chuỗi lân cận hoặc Layer 2 chịu trách nhiệm xử lý giao dịch.
Lỗi thứ hai của Ethereum
Tuy nhiên, sự chuyển hướng này đã không thể thiết lập một mạng lưới điểm đến điểm, nguyên nhân nằm ở lỗi kiến trúc thứ hai của Ethereum: từ bỏ mô hình UTXO của Bitcoin, chuyển sang mô hình Account.
Vào thời điểm đó, Vitalik đã đưa ra hai lập luận để chứng minh sự hợp lý của sự chuyển đổi này: 1) “UTXO về lý thuyết phức tạp, thực tế còn hơn nữa”; 2) “UTXO không có trạng thái, khó hỗ trợ các ứng dụng phức tạp cần quản lý trạng thái (như các loại hợp đồng thông minh)”.
Mặc dù những lập luận này có thể có giá trị vào thời điểm đó và được coi là đổi mới quan trọng, nhưng ngành đã đạt được tiến bộ lớn kể từ đó. Tính trạng thái — — duy trì và cập nhật “trạng thái” của blockchain hoặc tập hợp tất cả dữ liệu, số dư và điều kiện hiện tại do các giao dịch trong quá khứ tạo ra — — chắc chắn là cần thiết cho tính toán, nhưng mô hình Account không phải là con đường duy nhất để thực hiện trạng thái.
Năm 2017, Cardano đã phát hành mô hình UTXO mở rộng (eUTXO); năm 2019, Nervos đề xuất mô hình Cell — — một mô hình UTXO chung có trạng thái; gần đây, các nhà phát triển BitVM thậm chí đã hiện thực hóa tính toán trạng thái trên Bitcoin thông qua Taproot.
Nhìn lại quá khứ, việc chọn mô hình Account thay vì mô hình UTXO dường như là một quyết định tập trung vào ngắn hạn: mặc dù thuận tiện cho các nhà phát triển nhanh chóng xây dựng dApp, nhưng đã hy sinh nhiều lợi thế tự nhiên của mô hình UTXO.
Điều quan trọng là mô hình UTXO làm thế nào để đạt được quyền sở hữu thực sự về tài sản và dữ liệu — — đây chính xác là mục tiêu cốt lõi mà Web3 và Web5 cùng tuyên bố.
Mô hình UTXO không có tài khoản theo nghĩa truyền thống, mà theo dõi quyền sở hữu và chuyển nhượng tài sản thông qua địa chỉ và đầu ra giao dịch chưa chi tiêu (UTXO).
UTXO là đơn vị tiền điện tử đã được nhận nhưng chưa được chi tiêu, liên quan đến địa chỉ xác định ai có thể chi tiêu chúng. Trong mô hình này, người dùng quản lý vốn tương ứng với UTXO bằng cách kiểm soát khóa riêng. Tổng số UTXO này là vốn có sẵn của người dùng, mà không cần tài khoản truyền thống.
Trong khi đó, trong mô hình Account, tài khoản được chia thành tài khoản bên ngoài (EOA, do khóa riêng kiểm soát, có thể khởi xướng giao dịch) và tài khoản hợp đồng (CA, tức là hợp đồng thông minh, không thể chủ động khởi xướng giao dịch, được cấu thành từ mã và dữ liệu). Vấn đề là trong mô hình Account, tất cả tài sản không phải gốc (các mã thông báo ngoài ETH trong Ethereum) đều do CA quản lý. Điều này có nghĩa là tài sản không phải gốc trong mô hình này là công dân hạng hai. Số dư mã thông báo hiển thị trong ví người dùng không đại diện cho quyền sở hữu thực tế, mà các mã thông báo này do CA do EOA tạo ra kiểm soát.

Các trường hợp thực tế là cách tốt nhất để minh họa mức độ nghiêm trọng của vấn đề này. Brian Pellegrino, đồng sáng lập và CEO của LayerZero, gần đây đã chỉ ra rằng hợp đồng mã thông báo của giao thức tương tác đa chuỗi Across có lỗ hổng nghiêm trọng: một hàm trong hợp đồng mã thông báo cho phép chủ hợp đồng chuyển bất kỳ mã thông báo nào từ ví bất kỳ. Nói ngắn gọn, nhóm Across có thể đánh cắp mã thông báo từ bất kỳ người dùng nào nắm giữ chúng.
Thậm chí tồi tệ hơn, những trường hợp như vậy không phải là cá biệt. Nhiều hợp đồng mã thông báo bao gồm các chức năng tương tự, cho phép chủ hợp đồng tự do phát hành thêm, tiêu hủy mã thông báo, hoặc kiểm duyệt, tịch thu tài sản của người dùng.
Các nhà phát hành stablecoin tập trung mặc định tích hợp các chức năng như vậy (như một biện pháp tuân thủ cần thiết), cho phép họ tịch thu các mã thông báo bị nghi ngờ thu được trái phép (như thông qua lỗ hổng hoặc trộm cắp).
Trong khi đó, trong mô hình UTXO, tất cả tài sản đều được kiểm soát trực tiếp bởi khóa riêng của người dùng, là công dân hạng nhất. Lấy Nervos CKB sử dụng mô hình UTXO có trạng thái làm ví dụ, hợp đồng mã thông báo chỉ định logic mã thông báo (như “tổng cung 1 triệu mã thông báo” hoặc “phát hành 50 mã thông báo mỗi khối”), trong khi dữ liệu tài sản ghi nhận số dư của người dùng (như “Alice nắm giữ 100 mã thông báo”) được lưu trữ trong Cell do người dùng kiểm soát trực tiếp (có thể xem như UTXO có trạng thái). Điều này có nghĩa là, ngay cả khi hợp đồng mã thông báo bị tấn công, hacker cũng không thể đánh cắp tài sản của người dùng.
Lỗi thứ ba của Ethereum
Lỗi thứ ba của Ethereum là từ bỏ PoW để chuyển sang PoS. Lý do ủng hộ quyết định này bao gồm “PoS có ưu thế nổi bật về an ninh, giảm thiểu rủi ro tập trung và hiệu suất năng lượng” cùng với “an ninh cao hơn với cùng một chi phí.” Nhưng với nhiều độc giả, hiện nay đã rõ ràng: PoS không thể thay thế được PoW. Nếu còn nghi ngờ, hãy tham khảo (Tại sao theo chân Satoshi) hoặc (Thế giới cần thợ mỏ vì lý do gì).
Hơn nữa, thời gian cũng cung cấp bằng chứng để phản bác những lập luận này. Năm ngoái, chính Vitalik đã viết một bài dài cảnh báo về rủi ro tập trung vốn có của PoS. Dưới đây là một đoạn tóm tắt các quan điểm cốt lõi của ông:
“Một trong những rủi ro lớn nhất của Ethereum L1 là PoS có thể trở nên tập trung do áp lực kinh tế. Nếu có hiệu ứng kinh tế quy mô đối với sự tham gia của cơ chế PoS cốt lõi, các người xác thực lớn sẽ tự nhiên chiếm ưu thế trong mạng, trong khi các người xác thực nhỏ sẽ rút lui và tham gia vào các bể lớn hơn. Điều này sẽ dẫn đến gia tăng rủi ro tấn công 51%, kiểm duyệt giao dịch và các khủng hoảng khác. Ngoài rủi ro tập trung, còn có rủi ro lấy đi giá trị: một nhóm nhỏ có thể chiếm đoạt giá trị lẽ ra thuộc về người dùng Ethereum.”
Mặc dù Vitalik đã đưa ra một số giải pháp riêng biệt cho Ethereum trong bài viết, nhưng chúng tôi cho rằng điều này không có ích. Quyền lực tập trung và sự phụ thuộc vào bên thứ ba đáng tin cậy là thuộc tính tự nhiên của blockchain mô hình PoS + Account.
Hơn nữa, việc áp dụng đồng thuận PoS và mô hình Account sẽ gây ra một loạt phản ứng dây chuyền, cuối cùng khiến những mạng này hình thành cấu trúc topo khách hàng-máy chủ, gần với hệ thống Web2 hoàn toàn tập trung, thay vì hình thái lý tưởng của Web3.
Do đó, cách duy nhất để đạt được sự phi tập trung thực sự, kháng kiểm duyệt, không cần sự cho phép và tự quản lý tài sản dữ liệu (mục tiêu của Web3) là xây dựng một mạng lưới điểm đến điểm dựa trên hệ thống PoW+UTXO (Web5). Để hiểu điều này, chúng ta cần phân tích sâu sự khác biệt cốt lõi giữa blockchain PoS+Account và blockchain PoW+UTXO.
PoS+Account so với PoW+UTXO
Có sự khác biệt đáng kể giữa hệ thống PoS+Account và hệ thống PoW+UTXO, ảnh hưởng sâu sắc hơn đến cách thực hiện của chúng. Một số lựa chọn thiết kế có vẻ tinh tế có thể dẫn đến hình thức chuỗi khác nhau hoàn toàn.
Chúng tôi sẽ xác thực giả thuyết sau qua nhiều chiều: các chuỗi chọn mô hình PoS hoặc Account sẽ không bao giờ có thể hình thành một mạng điểm đến điểm thực sự phẳng.
Sự khác biệt trạng thái
Một chiều thứ nhất ủng hộ giả thuyết của chúng tôi là sự khác biệt trong giả định trạng thái giữa chuỗi PoW+UTXO và PoS+Account.

Ví dụ, trong hệ thống dựa trên UTXO, giao dịch là có trạng thái, bao gồm hai phần: đầu vào và đầu ra. Mỗi giao dịch chỉ rõ UTXO nào được tiêu thụ và tạo ra các UTXO mới nào, mang theo tất cả thông tin trạng thái cần thiết để cập nhật sổ cái. Tuy nhiên, môi trường trên chuỗi về bản chất là không có trạng thái, giao dịch chỉ có thể ảnh hưởng đến các UTXO mà nó tham chiếu trực tiếp, không thể sửa đổi các phần khác của sổ cái.

Ngược lại, trong hệ thống dựa trên Account, giao dịch là không có trạng thái — — chỉ chứa các lệnh thao tác (tức là hành động hoặc gọi phương thức mong muốn được thực hiện), mà không cần chỉ định rõ trạng thái hiện tại của các tài khoản liên quan. Môi trường trên chuỗi thì có trạng thái, bất kỳ giao dịch nào cũng có thể thay đổi trạng thái của bất kỳ tài khoản hoặc hợp đồng nào. Ví dụ, một hợp đồng thông minh có thể tương tác với nhiều tài khoản và thay đổi nhiều biến trạng thái, dẫn đến trạng thái hệ thống có độ liên kết cao.
Trong hệ thống dựa trên UTXO, giao dịch do người dùng tạo ra chỉ định rõ nội dung thay đổi sổ cái; trong khi trong hệ thống dựa trên Account, người dùng phụ thuộc vào các nút blockchain tính toán những thay đổi này.
Về cơ chế đồng thuận, đồng thuận PoS có trạng thái. Việc xác thực đồng thuận cần truy cập dữ liệu trên chuỗi, đặc biệt là tập hợp người xác thực hiện tại, trạng thái cổ phần của họ và số ngẫu nhiên. Do tập hợp người xác thực thay đổi động, các nút cần liên tục theo dõi các trạng thái này để xác thực khối mới.

Trong khi đó, đồng thuận PoW về bản chất là không có trạng thái: các nút chỉ cần xác thực bằng chứng công việc trong tiêu đề khối để xác nhận tính hợp lệ của blockchain, không cần thông tin trạng thái trên chuỗi thêm.

Sự khác biệt trong các giả định trạng thái này có nghĩa là, trong mô hình PoS+Account, người dùng phải theo dõi trạng thái toàn cầu để xác thực giao dịch, điều này yêu cầu vận hành nút đầy đủ.
Tuy nhiên, tính trạng thái của mô hình PoS+Account đã tăng đáng kể gánh nặng lưu trữ và tính toán cho nút đầy đủ. Các nút cần thực hiện độc lập tất cả các hợp đồng thông minh để xác thực giao dịch, theo dõi sự thay đổi của tập hợp người xác thực và lượng cổ phần của họ, và xử lý các xác thực, đề xuất và dữ liệu khác liên quan đến việc xác thực khối. Điều này dẫn đến việc các nút cần lưu trữ và tính toán thông tin trạng thái bổ sung.

So sánh dữ liệu có thể thể hiện rõ sự khác biệt: yêu cầu tối thiểu để vận hành nút đầy đủ của Ethereum là ổ cứng SSD 2TB, 16GB RAM, bộ xử lý Intel thế hệ thứ bảy trở lên; trong khi để vận hành nút đầy đủ của Bitcoin chỉ cần CPU tầm thấp, 2GB RAM và tối thiểu 15GB không gian đĩa khả dụng. Hơn nữa, Ethereum đang đối mặt với vấn đề bùng nổ trạng thái — — tốc độ tăng trưởng trạng thái của nó gấp 3.5 lần Bitcoin, và không thể cắt bỏ dữ liệu trạng thái cũ, nghĩa là không có giới hạn cho sự phát triển trạng thái.
Do yêu cầu phần cứng cao hơn để vận hành nút đầy đủ của chuỗi PoS+Account, số lượng người vận hành thực tế rất ít. Đồng thời, do tính phức tạp trong việc triển khai mô hình PoS+Account và sự đánh đổi về an ninh, các khách hàng nhẹ hoàn toàn không cần tin cậy gần như không tồn tại (xem bài viết sâu sắc của chúng tôi về vấn đề này), người dùng bị buộc phải phụ thuộc vào các dịch vụ RPC tập trung như Alchemy, Infura để truy cập blockchain.
Nói cách khác, đồng thuận PoS và mô hình Account đã tạo ra khó khăn cho việc vận hành nút đầy đủ, và khiến khách hàng nhẹ cần tối thiểu hóa tin cậy trở nên không khả thi, dẫn đến việc người dùng không còn lựa chọn nào khác ngoài việc đọc và cập nhật trạng thái thông qua một số RPC và API tập trung. Sự phụ thuộc này đã tạo ra cấu trúc mạng khách hàng-máy chủ, không khác gì mô hình tập trung của Web2.
Do đó, “Web3” đã tái hiện những vấn đề của Web2 mà nó muốn giải quyết: thiếu an ninh, quyền riêng tư và khả năng kháng kiểm duyệt. Các nhà cung cấp RPC phục vụ hầu hết người dùng Web3 có thể kiểm duyệt giao dịch, điều này đã được xác nhận trong sự kiện OFAC trừng phạt TornadoCash.
Các nhà cung cấp RPC này cũng thu thập dữ liệu người dùng, bao gồm địa chỉ blockchain và địa chỉ IP. Hơn nữa, vì hầu hết người dùng phụ thuộc vào lưu lượng của những nhà cung cấp này, nếu cơ sở hạ tầng tập trung của họ gặp sự cố hoặc ngoại tuyến, toàn bộ nhóm người dùng (đặc biệt là “người áp dụng quy mô lớn”) sẽ không thể truy cập blockchain, như sự cố gián đoạn dịch vụ của Infura vào năm 2018 do tắc nghẽn gây ra bởi CryptoKitties.
Ngược lại, hệ thống PoW+UTXO, nút đầy đủ, SPV và khách hàng nhẹ dễ dàng thực hiện, người dùng không cần phụ thuộc vào bên thứ ba đáng tin cậy để xác thực giao dịch. Điều này thúc đẩy cách tham gia blockchain trực tiếp (và do đó riêng tư hơn) và cấu trúc topo mạng điểm đến điểm, đạt được sự phi tập trung thực sự.
Sự khác biệt xác định
Blockchain về bản chất là một máy trạng thái xác định được sao chép, điều này khiến nó trở thành “nguồn chân lý duy nhất” được mọi người công nhận.
Cách thể hiện tính xác định giữa PoW+UTXO và PoS+Account khác nhau, dẫn đến sự khác biệt trong topo mạng, đặc biệt thể hiện rõ ở việc bầu chọn người xác thực, thời gian xuất khối và tính cuối cùng.

Trong hệ thống PoS, việc bầu chọn người xác thực là xác định — — các người xác thực lần lượt xuất khối theo quy tắc đã định. Cách này tuy nâng cao hiệu quả nhưng lại giới thiệu một điểm yếu: địa chỉ IP của người xác thực bị công khai, kẻ tấn công có thể nhắm vào một người xác thực cụ thể để phát động cuộc tấn công DDoS, dẫn đến mạng bị tê liệt trong thời gian họ xuất khối. Hơn nữa, các người xác thực cần phải hiểu nhau và phối hợp tốt, vì sức khỏe của mạng phụ thuộc vào điều này.
Hơn nữa, việc xuất khối xác định khiến các người xác thực ở vị trí thuận lợi, có thể khai thác kinh tế từ người dùng. Các công ty chuyên nghiệp tận dụng tài nguyên và thu nhập để mở rộng quy mô cổ phần, liên tục thu được phần thưởng khối và MEV, tạo thành một chu trình phản hồi tích cực “người giàu ngày càng giàu hơn”. Chuỗi cung ứng MEV và sự tập trung của các nhà xây dựng khối càng khiến xu hướng này trở nên tồi tệ hơn.
Trong khi đó, trong chuỗi PoW, việc bầu chọn người xác thực là không xác định. Trước khi khối được khai thác, không ai biết khối tiếp theo sẽ được tạo ra bởi ai, điều này thúc đẩy sự bình đẳng giữa các nút trong mạng điểm đến điểm. Tập hợp đồng thuận cũng là không xác định, thợ mỏ có thể tự do tham gia hoặc rời khỏi mạng, bất kỳ nút nào cũng có thể tạo ra khối, không có thợ mỏ nào là cần thiết cho sự tiếp tục của chuỗi. Điều này là không thể trong PoS, vì tập hợp đồng thuận là xác định, một số người xác thực phải có mặt để thúc đẩy sự phát triển của chuỗi.
Vì vậy, mạng PoW trở nên mạnh mẽ hơn, không có nút nào ở vị trí thuận lợi, cũng không có nút nào được đảm bảo có cơ hội lợi dụng người dùng để trục lợi.
Hình dạng có thể của Web5 trong tương lai
Mạng gồm các chuỗi PoW+UTXO vẫn là điều không tưởng đối với nhiều người. Web3 đã trở thành một cỗ máy công nghiệp, liên tục sản xuất các hệ thống mới để giải quyết các vấn đề phát sinh từ Ethereum. Mặc dù một số nhà tư tưởng đã bắt đầu hiểu được sự tinh tế của PoW+UTXO, Web3 vẫn hoàn toàn xây dựng trên mô hình PoS+Account.
Mặc dù Jack Dorsey không thể dẫn dắt dự án TBD đến miền đất hứa, nhưng thật mỉa mai, tương lai của Web5 thực sự là TBD (còn phải xác định).
Ngay cả Satoshi cũng đã tưởng tượng ra một thế giới được tạo thành từ một blockchain khổng lồ và các nút/mỏ công nghiệp. Vũ trụ Web3 ngày nay bao gồm những điều này; tuy nhiên, chúng tôi luôn suy nghĩ về chuỗi: MetaMask chỉ vào RPC nào? Tài sản được cầu nối đến chuỗi nào? Định dạng địa chỉ có đúng tiêu chuẩn không? Và nhiều thứ khác nữa.
Trong ngành mà mỗi chi tiết khái niệm kỹ thuật dường như có mã thông báo và đội ngũ riêng, việc coi blockchain là lớp cam kết thực sự bên ngoài chuỗi lại là một lĩnh vực hoàn toàn mới. Thật đáng mừng, chúng tôi đã bắt đầu hiện thực hóa tầm nhìn về Web5.
Mặc dù ban đầu gây tranh cãi (có thể “rgbp2p” là một cái tên tốt hơn), RGB++ đang dẫn dắt làn sóng Web5, tích hợp Bitcoin và Nervos CKB một cách không cần tin cậy, không cần cầu nối đa chuỗi hay cơ chế an ninh đáng ngờ. Sự hỗ trợ của Dogecoin đang được phát triển, trong tương lai có thể kết nối với các chuỗi PoW+UTXO như Kaspa, Ergo.

Tiến bộ của mạng kênh càng đáng phấn khởi hơn. Trong phần lớn thời gian năm 2024, dự án Fiber Network đang nỗ lực hiện thực hóa mạng kênh tương thích với Lightning Network trên CKB, hiện đang nhanh chóng tiến tới mạng chính. Mặc dù Lightning Network nổi tiếng với độ khó cao, CKB cung cấp nền tảng tính toán mới, cho phép thử nghiệm các cải tiến khác nhau của Lightning Network mà không cần thay đổi đồng thuận.
Nhóm Polycrypt đã làm việc trên mạng kênh trạng thái gần bảy năm, gần đây phát hành chức năng tích hợp giữa tài khoản và mô hình UTXO, hỗ trợ tám chuỗi, bao gồm Ethereum, Polkadot, Dfinity, Cardano, Cosmos, Stellar, Fabric và CKB.
Trong làn sóng BitVM và sự hồi sinh của Bitcoin, với sự trưởng thành của Taproot Assets, sự hồi sinh ngoài chuỗi cũng đang bắt đầu. Các nhóm như Ark, Mercury đang khám phá những khả năng mới của tính toán ngoài chuỗi gốc của Bitcoin.
Kết luận
Cách duy nhất để hiện thực hóa sự phi tập trung thực sự, kháng kiểm duyệt, không cần sự cho phép và tự quản lý tài sản dữ liệu mà Web3 tuyên bố là xây dựng một mạng lưới có cấu trúc topo điểm đến điểm. Đến nay, chỉ có hệ thống PoW+UTXO là khả thi.
Trong vũ trụ PoW, tỷ lệ thành công của blockchain là rất thấp, chúng giống như những ngôi sao băng thoáng qua chứ không phải là cửa hàng tiện lợi. Những điều kỳ diệu hoặc bất ngờ đẹp đẽ này chỉ được sử dụng cho sự đồng thuận và thanh toán cuối cùng, bất kỳ ai cũng có thể tham gia vận hành. Việc xác thực giữ chi phí thấp, dễ dàng tiếp cận, và người dùng có thể chạy nút đầy đủ hoặc khách hàng nhẹ trên phần cứng thông thường.
Tăng thông lượng bằng cách mở rộng dọc (thêm kênh thanh toán hoặc kênh trạng thái vào lớp nền). Trạng thái được quản lý qua UTXO, cho phép người dùng chỉ xác thực các giao dịch liên quan đến họ mà không cần phụ thuộc vào trung gian tập trung.
Con đường đổi mới luôn đầy bất định, tương lai của Web5 cũng không ngoại lệ. Nhưng như Nervos và các nhà phát triển khách hàng Nostr Retric đã nói trong bài viết này: “Đây là một cộng đồng sống động được thúc đẩy bởi các giá trị như tự do, phi tập trung và giao tiếp mở. Đây không chỉ là công nghệ — — đây là một phong trào.”
Sau mười năm quan sát Web3, chúng tôi đã chứng kiến rất ít bất ngờ và giờ đã sẵn sàng để thoát khỏi những chiếc còng này. Chúng tôi đã sẵn sàng để đối mặt với sự không chắc chắn. Hy vọng bạn cũng vậy.
Đặc biệt cảm ơn Jan, Aijan và Neon đã xem xét bài viết này và đưa ra những gợi ý quý giá.
Theo dõi tác giả trên X @radicalizedpleb, @matt_bitcoin


