Tôi đã xây dựng một runtime quản lý 10.000 đại lý song song mà không thực hiện một hành động nào không được phép.
Hôm nay tôi đã chạy một mô phỏng để lại cho tôi một câu hỏi thú vị hơn cả những con số.
10.000 đại lý hoạt động song song, mỗi đại lý đề xuất hành động cho một runtime quản trị trong các chu kỳ 800ms.
Kiến trúc:
5 shards hoạt động + 1 standby nóng
250 công nhân
pipeline: danh tính → giới hạn tỷ lệ → runtime DSL → thực thi → kiểm toán
Kết quả của bài kiểm tra stress với 300 ticks:
~2.8M quyết định được đánh giá
p99 trung bình: 280ms. Đỉnh thấp cascade: ~490ms
0 hành động không được phép thực hiện — không có một cái nào
Điều tôi quan tâm không phải là thông lượng.
Mà là khoảnh khắc khi shard-2 bị sập, standby hấp thụ 2.000 đại lý trong chưa đầy một tick, và hệ thống tiếp tục mà không có đại lý nào thực hiện bất kỳ hành động nào ngoài chính sách.
Trong các hệ thống giao dịch thuật toán, một đại lý thực hiện một lệnh ngoài chính sách không phải là lỗi phần mềm. Đó là một tổn thất thực sự hoặc một vi phạm quy định. WEZ đánh giá từng hành động trước khi thực hiện — không phải sau khi quan sát nó.
Điều đó không phải là khả năng phục hồi kỹ thuật.
Đó là quản trị như một cơ sở hạ tầng.
Khi các đại lý quản lý vốn, quản trị không thể là tùy chọn và không thể sống trong prompt.
Nó phải nằm trong runtime.
Đó là những gì tôi đang xây dựng với WEZ.
#AI #AgentSystems #AIInfrastructure #RuntimeGovernance #AlgoTrading
#TradingBots