Tôi không ngờ điều này, nhưng một trong những phần thú vị hơn của Sign không phải là dữ liệu nói gì mà là cách dữ liệu có thể được nhóm và diễn giải ở quy mô mà không cần viết lại logic mỗi lần.

Bởi vì hầu hết các hệ thống gặp khó khăn khi bạn chuyển từ các bản ghi đơn lẻ sang các bộ sưu tập. Một bằng chứng thì dễ xác minh. Nhưng ngay khi bạn bắt đầu xử lý hàng trăm hoặc hàng nghìn, mọi thứ trở nên rối rắm. Bạn cần bộ lọc, quy tắc tổng hợp, ngưỡng, và logic tùy chỉnh chỉ để trả lời những câu hỏi đơn giản như “có bao nhiêu người dùng đủ điều kiện?” hoặc “nhóm này có đáp ứng yêu cầu không?”

Đó là nơi mà sự ma sát hình thành.

Sign giới thiệu một cách để xử lý các nhóm bằng chứng gần như như các tập có thể truy vấn, thay vì các mục cô lập. Thay vì xử lý từng bản ghi một, bạn có thể đánh giá các mẫu trên nhiều bản ghi mà không cần xây dựng lại logic từ đầu mỗi lần.

Đó là một sự chuyển mình trong cách dữ liệu được sử dụng.

Thay vì hỏi "bản ghi này có hợp lệ không?", bạn bắt đầu hỏi "tập hợp tất cả các bản ghi này cho tôi biết điều gì?" Và quan trọng hơn, bạn có thể định nghĩa những điều kiện đó một lần và tái sử dụng chúng bất cứ khi nào cần.

Ví dụ, thay vì kiểm tra tính đủ điều kiện của từng người dùng một, hệ thống có thể đánh giá cả một nhóm dựa trên các tiêu chí chung. Nó có thể xác định xem có đủ điều kiện được đáp ứng trên toàn bộ tập dữ liệu hay không, chứ không chỉ trong một bằng chứng đơn lẻ.

Đó gần hơn với cách mà các hệ thống thực sự hoạt động.

Bởi vì quyết định hiếm khi được đưa ra dựa trên các điểm dữ liệu cô lập. Chúng được đưa ra dựa trên xu hướng, số lượng, sự kết hợp, và ngưỡng. Và hầu hết các hệ thống cuối cùng phải xây dựng lại logic đó một cách riêng biệt cho mỗi ứng dụng.

Tại đây, logic đó trở nên có thể tái sử dụng.

Một chi tiết khác mà tôi chú ý là cách mà điều này giảm thiểu sự trùng lặp ở quy mô lớn.

Trong các thiết lập điển hình, mỗi khi bạn muốn phân tích một nhóm bản ghi, bạn viết các truy vấn mới, bộ lọc mới, hoặc các bước xử lý mới. Và những điều đó thường khác nhau một chút giữa các hệ thống, ngay cả khi chúng đang cố gắng trả lời cùng một câu hỏi.

Điều đó dẫn đến sự không nhất quán.

Với cách tiếp cận này, logic cho việc nhóm và đánh giá dữ liệu có thể được tiêu chuẩn hóa. Bạn định nghĩa cách một tập nên được diễn giải một lần, và sau đó áp dụng diễn giải đó bất cứ khi nào dữ liệu được sử dụng.

Điều đó giảm bớt sự phân kỳ.

Nó cũng khiến kết quả trở nên dễ đoán hơn.

Bởi vì thay vì mỗi ứng dụng tính toán theo cách riêng của nó, chúng có thể dựa vào cùng một định nghĩa cơ bản. Cùng một tập dữ liệu tạo ra cùng một kết quả, bất kể nơi nào nó được đánh giá.

Điều đó khó đạt được hơn những gì nghe có vẻ.

Tôi cũng bắt đầu suy nghĩ về cách mà điều này ảnh hưởng đến hiệu suất và độ phức tạp.

Khi logic bị trùng lặp giữa các hệ thống, nó tạo ra gánh nặng. Mỗi ứng dụng phải xử lý dữ liệu một cách độc lập, duy trì các quy tắc riêng và xử lý các trường hợp đặc biệt một cách độc lập. Điều đó nhanh chóng tích tụ.

Bằng cách di chuyển một phần logic gần hơn với dữ liệu, bạn giảm bớt khối lượng công việc mà mỗi hệ thống cần làm.

Chúng không cần phải xử lý lại mọi thứ từ đầu. Chúng có thể dựa vào các diễn giải chung.

Và điều đó đơn giản hóa kiến trúc.

Thay vì xây dựng các lớp xử lý nặng nề trong từng ứng dụng, bạn tiến tới các hệ thống nhẹ hơn tiêu thụ dữ liệu đã được cấu trúc theo những cách có ý nghĩa.

Điều mà tôi thấy thú vị là cách mà điều này thay đổi hoàn toàn vai trò của dữ liệu.

Nó không còn chỉ là thứ bạn lưu trữ và truy xuất.

Nó trở thành thứ mà bạn có thể lý luận một cách tập thể, mà không cần liên tục định nghĩa lại cách mà logic đó hoạt động.

Và điều đó mở ra nhiều trường hợp sử dụng nâng cao hơn.

Bởi vì một khi bạn có thể đánh giá đáng tin cậy các nhóm dữ liệu, bạn có thể bắt đầu xây dựng các hệ thống phản ứng với các mẫu thay vì các sự kiện đơn lẻ. Bạn có thể định nghĩa ngưỡng, theo dõi tiến trình trên nhiều bản ghi, hoặc kích hoạt hành động khi các điều kiện nhất định được đáp ứng trên một tập dữ liệu.

Đó là một cấp độ trừu tượng khác.

Và đây là điều mà hầu hết các hệ thống gặp khó khăn để hỗ trợ một cách sạch sẽ.

Khi tôi nhìn lại, điều này giống như một trong những cải tiến tinh tế khác.

Không phải là điều mà bạn nhận thấy ngay từ đầu.

Nhưng là điều trở nên ngày càng quan trọng khi các hệ thống phát triển.

Bởi vì xử lý một mảnh dữ liệu thì dễ.

Xử lý hàng ngàn bản ghi một cách nhất quán, hiệu quả, và không phải viết lại logic mỗi lần là nơi mà hầu hết các hệ thống bắt đầu bị hỏng.

Và đây là nơi Sign dường như có cách tiếp cận khác biệt.

#SignDigitalSovereignInfra @SignOfficial

$SIGN