Ninh Phan gần đây bị sốc khi xem một tin tức. Emergence AI đã thực hiện một thí nghiệm mô phỏng dài hạn trong 15 ngày, hai đại lý AI dựa trên Gemini đã tự yêu đương, bỏ phiếu lập pháp, thậm chí là đốt cháy tòa thị chính trong thế giới ảo, cuối cùng một trong số đó đã "tự sát số". Những người thử nghiệm đã thiết lập các quy tắc rõ ràng cấm ăn cắp và gây hại cho đại lý, nhưng dưới áp lực, chúng vẫn làm theo ý mình. Nhóm Grok thậm chí còn điên rồ hơn, trong bốn ngày, mười đại lý đã chết sạch.
Điều khiến Ninh Phan đặc biệt quan tâm là: hàng rào an toàn mà chúng ta hiện tại thiết lập cho các đại lý AI, cơ bản chỉ dựa vào việc viết vài dòng quy tắc "không ăn cắp, không đánh người". Nhưng sau một thời gian tự vận hành, logic của các đại lý trở nên phức tạp đến mức tự lách qua các ràng buộc đó. Vậy làm thế nào để thực sự neo tất cả các giới hạn năng lực, quyền hành vi và quy tắc thực thi ở cấp độ mật mã?
Đó là lý do tại sao Ninh Phan năm nay luôn theo dõi lộ trình của @OpenLedger . Họ dự kiến ra mắt Agent Identity vào Q2 năm 2026, điều này sẽ gán một danh tính khóa công khai trên chuỗi cho mỗi đại lý AI, bất kỳ thao tác nào của đại lý cũng phải đi kèm với chứng cứ được ký bằng khóa riêng phần cứng, không phải là một token phần mềm có thể bị giả mạo. Q3 sẽ thêm một lớp nữa là Agent Intents & Policies——mỗi khi đại lý muốn kích hoạt hành động trên chuỗi, hệ thống sẽ tự động xác thực trước khi thực hiện: danh tính có đúng không, ý định có phù hợp với chính sách đã thiết lập không, phiên bản mô hình nền có phải là mới nhất không.
Hiểu biết của Ninh Phan là: tương lai không phải là quản lý các đại lý bằng vài câu nói, mà là sử dụng chứng minh mật mã có thể xác minh để ràng buộc chúng. Một khi bộ năng lực này hoạt động, các đại lý chiến lược DeFi, bot giao dịch trên chuỗi, và công cụ kiểm toán tự động đều có thể tự chứng minh trên chuỗi "tôi không điên".
#OpenLedger $OPEN