Cách Tiếp Cận OpenLedger Đối Với Watermarking Mô Hình AI và Theo Dõi Nguồn Gốc

Mình từng nghĩ rằng một khi mô hình AI được phát hành, nguồn gốc của nó sẽ không thể xác minh được.
Có ai đó đào tạo một mô hình trên @OpenLedger  sử dụng các bộ dữ liệu quý giá. Họ tải lên để chia sẻ hoặc cấp phép. Người khác tải xuống, tinh chỉnh, sửa đổi các tham số, và tự nhận là tác phẩm của mình.. Người tạo ra bản gốc không có chứng cứ.. Không có cách nào để theo dõi nơi công việc của họ đã đi. Không có cách nào để chứng minh một phiên bản đã sửa đổi bắt đầu từ mô hình của họ.
OpenLedger giải quyết vấn đề này thông qua watermarking mô hình và theo dõi nguồn gốc.
Watermarking nhúng một định danh ẩn trực tiếp vào các trọng số toán học của mô hình. Không thể nhìn thấy trong quá trình sử dụng bình thường. Không thể gỡ bỏ mà không làm hỏng chức năng của mô hình hoặc làm giảm hiệu suất một cách đáng kể. Bất kỳ ai cũng có thể trích xuất watermark sau đó để chứng minh quyền sở hữu. Nghĩ đơn giản như một chữ ký số được nướng vào DNA của mô hình. Không phải là một thẻ đính kèm bên ngoài. Không phải là một trường siêu dữ liệu có thể bị xóa. Watermark vẫn tồn tại qua quá trình tinh chỉnh, nén, và chuyển đổi định dạng.
Các bản ghi theo dõi provenance ghi lại mọi tương tác với một mô hình trên OpenLedger. Khi một mô hình được tạo ra, các bản ghi giao dịch ghi lại ai đã xây dựng nó, mô hình cơ sở nào đã được sử dụng, bộ dữ liệu nào đã được đào tạo nó và những sửa đổi nào đã được áp dụng. Khi ai đó tải xuống một mô hình, việc chuyển giao đó được ghi lại. Khi ai đó tinh chỉnh một mô hình hiện có, phiên bản mới liên kết trở lại với phiên bản gốc. Lịch sử hoàn chỉnh tạo thành một chuỗi không thể phá vỡ.
Hai cơ chế này hoạt động cùng nhau. Watermarking (đánh dấu) cung cấp bằng chứng mã hóa về nguồn gốc. Provenance (nguồn gốc) cung cấp lịch sử sở hữu và sửa đổi minh bạch. Không cơ chế nào phụ thuộc vào lòng tin. Cả hai đều có thể được xác minh trên chuỗi.
Tại sao điều này lại quan trọng đối với người dùng OpenLedger? Một nhà sáng tạo mô hình, người đầu tư thời gian và tài nguyên vào việc đào tạo, muốn được ghi công và bồi thường. Nếu không có watermarking, bất kỳ ai cũng có thể sao chép mô hình và cấp phép nó ở nơi khác mà không cần thanh toán. Nếu không có provenance, các tranh chấp về việc ai đã tạo ra cái gì trở nên không thể giải quyết...
OpenLedger làm cho việc sao chép mà không ghi công trở nên đắt đỏ và dễ phát hiện. Một kẻ trộm tải xuống một mô hình đã được đánh dấu và cố gắng bán nó như của riêng mình sẽ bị phát hiện khi người mua lấy watermark. Một mô hình được tinh chỉnh mà vẫn giữ lại các phần của watermark gốc vẫn chỉ về nguồn gốc. Các bản ghi provenance cho thấy chuỗi quyền sở hữu từ người sáng tạo ban đầu đến kẻ trộm...
Đối với người mua mô hình, watermarking và provenance cung cấp đảm bảo tính xác thực. Một người mua có thể xác minh rằng một mô hình đến từ một nhà sáng tạo uy tín, không phải từ một kẻ giả mạo. Bản ghi provenance cho thấy dữ liệu đào tạo của mô hình, lịch sử sửa đổi và các điều khoản cấp phép. Không có bất ngờ. Không có vi phạm bản quyền ẩn.
Đối với hệ sinh thái rộng lớn hơn, những cơ chế này cho phép ghi công ở quy mô lớn. Hàng ngàn mô hình. Hàng ngàn người đóng góp. Mỗi mô hình đều có thể truy nguyên trở lại người sáng tạo của nó. Mỗi người đóng góp có thể chứng minh công việc của họ. Đây là cách OpenLedger xây dựng lòng tin vào nền kinh tế AI mà không phụ thuộc vào các cơ quan trung ương.
Việc triển khai kỹ thuật sử dụng các băm mã hóa được gắn vào chuỗi của OpenLedger. Mỗi mô hình được cấp một định danh duy nhất khi được tạo ra. Các thuật toán watermarking nhúng một phiên bản đã ký của định danh đó. Các bản cập nhật provenance thêm các băm mới tham chiếu đến các phiên bản trước. Kết quả là một bản ghi không thể thay đổi mà bất kỳ ai cũng có thể kiểm toán.
Watermarking không ảnh hưởng đến hiệu suất của mô hình. Các định danh ẩn thêm overhead không đáng kể. Tốc độ suy diễn vẫn giữ nguyên. Độ chính xác vẫn giữ nguyên. Sự khác biệt duy nhất là các nhà sáng tạo có thể chứng minh quyền sở hữu.
Provenance không làm chậm việc sử dụng mô hình. Các bản ghi lịch sử tồn tại trên chuỗi nhưng không làm cản trở hoạt động bình thường. Việc xác minh diễn ra khi cần thiết, không phải trên mỗi lần suy diễn.
Tôi từng nghĩ quyền sở hữu mô hình là không thể thi hành trong các hệ sinh thái AI mở. Khi mã rời khỏi quyền kiểm soát của bạn, bạn mất quyền kiểm soát. Watermarking và provenance của OpenLedger thay đổi giả định đó. Không phải bằng cách hạn chế quyền truy cập. Mà bằng cách làm cho quyền sở hữu có thể chứng minh và phát hiện trộm cắp.
Một nhà sáng tạo có thể cấp phép mô hình đã được đánh dấu của họ trên thị trường của OpenLedger. Người mua có thể xác minh tính xác thực trước khi mua. Nếu ai đó cố gắng bán lại mô hình mà không có sự cho phép, watermark sẽ lộ diện họ. Nếu xảy ra tranh chấp, bản ghi provenance sẽ giải quyết.
Đây là cách OpenLedger bảo vệ các nhà sáng tạo mà không xây dựng tường quanh các mô hình. Quyền truy cập mở. Quyền sở hữu có thể xác minh. Sao chép có thể chịu trách nhiệm.
Watermarking và provenance không phải là các tính năng trong tương lai. Chúng hoạt động trong cơ sở hạ tầng hiện tại của OpenLedger hôm nay. Bất kỳ mô hình nào được đào tạo hoặc niêm yết trên OpenLedger đều có thể bao gồm watermarking. Mọi giao dịch mô hình đều được ghi lại trong các bản ghi provenance.
Đối với bất kỳ ai đã từng có công việc của họ bị sao chép mà không ghi công, OpenLedger cung cấp một cách tốt hơn. Không hoàn hảo. Không có gì là. Nhưng tốt hơn việc tin tưởng vào người lạ để làm điều đúng đắn.
Đó là cách tiếp cận của OpenLedger đối với watermarking và provenance của mô hình AI. Bảo vệ vô hình. Lịch sử có thể xác minh. Ghi công công bằng cho các nhà sáng tạo.
\u003cm-10/\u003e
\u003cc-59/\u003e
\u003ct-7/\u003e