Luke Barwikowski, CEO của Pixels, nói một câu trong cuộc phỏng vấn cuối năm 2025 mà mình nghĩ là câu quan trọng nhất bất kỳ ai build trong Web3 gaming đã nói trong nhiều năm gần đây: "The metric that matters from 2025 is RORS, return on reward spend. There are teams focused on whether they are bringing in more value than they are giving out, and those are the teams that have survived."
Mình đọc lại một lần nữa. Không phải vì câu đó phức tạp. Mà vì mình nhận ra rằng đây là lần đầu tiên mình thấy một founder trong Web3 gaming nói thẳng rằng metric mà cả ngành đang đo, DAU, token price, TVL, là metric sai. Và metric đúng là thứ gần như không ai đang tính.
RORS, return on reward spend, là câu hỏi đơn giản nhất và khó trả lời nhất trong gaming có reward: mỗi đồng bạn bỏ ra để reward người chơi có mang về nhiều hơn một đồng hay không? Nếu có, reward system đang tạo ra giá trị thực. Nếu không, bạn đang mua retention tạm thời bằng cách đốt ngân sách, và đó chỉ là vấn đề thời gian trước khi hệ thống sụp đổ.
Để hiểu tại sao phần lớn Web3 gaming không tính được RORS, mình cần giải thích một vấn đề cơ bản hơn trong cách các dự án đó được build. Khi một game launch với token và reward system, đội ngũ thường không có infrastructure để theo dõi chính xác hành vi nào của người chơi thực sự tương quan với việc họ ở lại lâu hơn, chi tiêu nhiều hơn, hoặc giới thiệu người khác vào. Họ thấy DAU, thấy token flow, thấy leaderboard activity. Nhưng họ không thấy được liệu một đồng reward chi ra hôm nay có dẫn đến hai đồng revenue trong 30 ngày tới hay không.
Đây không phải là thiếu sót kỹ thuật đơn giản. Đây là thiếu sót về kiến trúc. Để tính RORS một cách đáng tin cậy, bạn cần gắn từng reward action với player ID cụ thể, theo dõi hành vi của player đó sau khi nhận reward, đo impact của reward đó lên revenue, retention, và LTV trong một khoảng thời gian đủ dài, rồi so sánh với control group không nhận reward đó. Đây là pipeline data science phức tạp, đòi hỏi đội ngũ và infrastructure mà phần lớn game studio không có và không nên phải tự build.

Đây là điểm mà Stacked trở nên thú vị theo một cách mà phần lớn người đang bỏ qua. Stacked không chỉ là một reward platform. Nó là infrastructure để tính RORS một cách đáng tin cậy cho bất kỳ studio nào tích hợp. Studio gắn SDK vào game, event data từ game chảy vào Stacked, hệ thống gắn reward action với player behavior theo thời gian thực, và RORS được tính tự động cho từng campaign, từng cohort, từng loại reward.
Điều đó có nghĩa là một studio tích hợp Stacked không chỉ nhận được một reward engine. Họ nhận được khả năng đo một metric mà trước đây họ không có infrastructure để tính. Và khi bạn có thể đo RORS, bạn có thể optimize cho nó, cắt những reward không hiệu quả, tăng những reward có ROI thực, và biến reward budget từ một khoản chi phí mờ nhạt thành một investment có thể audit được.
Mình cần thành thật về một giới hạn quan trọng ở đây. RORS như một metric chỉ có ý nghĩa nếu attribution model phía sau nó đủ chính xác. Attribution trong gaming, việc xác định reward nào đã dẫn đến revenue nào, là một bài toán khó bởi vì player behavior có nhiều confounding variables. Một người chơi spend sau khi nhận reward có thể spend vì reward thực sự tạo ra nhu cầu, hoặc có thể họ đã sắp spend rồi và reward chỉ là trigger tình cờ. Phân biệt hai trường hợp đó đòi hỏi experimental design tốt, control group đủ lớn, và đủ thời gian để loại bỏ noise.
Pixels có lợi thế ở đây vì họ đã vận hành trong production đủ lâu để có đủ data và đủ experiments để attribution model của họ có baseline ổn định. Câu hỏi là khi Stacked mở ra external studios với game mechanics khác, genre khác, player behavior khác, model đó có giữ được độ chính xác hay cần được recalibrate đáng kể cho từng game không.

Nhìn vào sơ đồ decoupling đó, mình muốn giải thích tại sao việc tách game design ra khỏi reward logic không chỉ là lợi thế về organizational efficiency mà là điều kiện cần để RORS có thể được đo chính xác. Khi game mechanics và reward logic nằm trong cùng một codebase và cùng một team phải xử lý cả hai, attribution bị entangled. Bạn không thể biết liệu người chơi quest vì quest thú vị hay vì reward của quest đó, vì người thiết kế quest cũng là người thiết kế reward. Signal bị noise hoá bởi những quyết định design không được document rõ ràng.
Khi Stacked tách reward layer ra ngoài hoàn toàn, attribution trở nên sạch hơn. Game gửi event: "player X hoàn thành action Y lúc timestamp Z." Stacked xử lý riêng: "player X có profile Z, nhận offer A, sau đó có hành vi B hay không." Hai layer đó không biết về internal logic của nhau, và chính sự tách biệt đó tạo ra khả năng đo attribution đáng tin cậy hơn.
Luke Barwikowski nói điều này trực tiếp trong AMA tháng 3 năm 2026: Stacked đã giải phóng game team để chỉ tập trung vào gameplay, trong khi platform team tập trung vào reward optimization và data science. Đây không phải là lợi thế về tốc độ phát triển. Đây là lợi thế về chất lượng của dữ liệu, vì khi hai thứ được tách biệt rõ ràng, mỗi thứ có thể được đo độc lập.
Mình muốn kết lại bằng điều mà mình thấy là implication quan trọng nhất của câu chuyện RORS với $PIXEL. Nếu Stacked thực sự trở thành layer mà nhiều studio dùng để tính và optimize RORS, thì $PIXEL đang ngồi trong trung tâm của một hệ thống đo lường giá trị, không chỉ một hệ thống phân phối reward. Sự khác biệt đó là rất lớn, bởi vì hệ thống đo lường giá trị có network effect theo một cách mà hệ thống phân phối reward không có. Mỗi studio tích hợp thêm data vào pool, model tốt hơn, attribution chính xác hơn, và RORS của tất cả studio còn lại cũng được cải thiện theo.
Đó là flywheel mà mình đang theo dõi. Không phải số lượng studio tích hợp. Mà là chất lượng của attribution model sau 12 tháng có nhiều game đa dạng đang chạy trong cùng một hệ thống.
