Các bài kiểm tra thông thường thường đánh giá một AI dựa trên một nhiệm vụ rõ ràng. Một câu hỏi, một câu trả lời, một điểm số. Nó sạch sẽ, nhanh chóng, và đáng tin cậy. Nhưng định dạng này gần như không nói lên điều gì về những gì xảy ra sau vài ngày hành động liên tục. Giới hạn này trở nên nhạy cảm hơn với các tác nhân AI tự động bị phơi bày trước các cạm bẫy phức tạp, đặc biệt là khi chúng có công cụ, bộ nhớ, và các mục tiêu bền vững.
Do đó, AI Emergence đã đặt các tác nhân vào các môi trường bền vững. Chúng có thể hợp tác, bỏ phiếu, sử dụng công cụ, điều hướng các thành phố ảo, và đưa ra quyết định theo các quy tắc xã hội. Cài đặt này trông ít giống như một bài kiểm tra và nhiều hơn như một xã hội nhân tạo nhỏ.
Các nhà phát triển sẽ phải kiểm tra các đại lý theo thời gian. Không chỉ trong vài phút. Họ sẽ phải quan sát các tương tác, bộ nhớ, quyết định lặp lại và phản ứng với xung đột. Nếu không, các AI sạch sẽ được xác thực trong phòng thí nghiệm nhưng sẽ yếu đuối ngoài thực địa.
Giải pháp không phải là chặn các đại lý AI. Mà là giới hạn quyền hạn của chúng, theo dõi hành động của chúng, áp đặt các ngưỡng dừng lại, và kiểm toán các môi trường mà chúng phát triển. Yêu cầu này trở nên cấp bách khi các đại lý AI tiến gần hơn đến thanh toán crypto và stablecoin. Một AI tự động phải vẫn hữu ích. Nhưng nó không bao giờ được trở thành một hộp đen với chìa khóa trong tay.
Tối đa hóa trải nghiệm Cointribune của bạn với chương trình "Đọc để Kiếm" của chúng tôi! Mỗi bài viết bạn đọc, kiếm điểm và truy cập các phần thưởng độc quyền. Đăng ký ngay và bắt đầu kiếm lợi ích.