OpenAI și Paradigm lansează EVMbench pentru a asigura economia AI-Crypto
Pe 18 februarie 2026, OpenAI și Paradigm au introdus EVMbench, un nou sistem de benchmarking conceput special pentru a evalua și asigura performanța agenților AI în cadrul ecosistemului Ethereum Virtual Machine (EVM).
Bankless
Bankless
+1
Prezentare generală a EVMbench
Acest benchmark abordează nevoia în creștere de siguranță și fiabilitate pe măsură ce agenții AI autonomi sunt utilizați din ce în ce mai mult pentru a gestiona tokenuri crypto și a executa contracte inteligente.
arXiv
arXiv
+1
Securitate țintită: Oferă un cadru standardizat pentru a testa cât de bine pot manevra modelele AI în medii blockchain cu mize mari și adversariale.
Detectarea vulnerabilităților: Sistemul evaluează capacitatea unui agent de a identifica exploatările contractelor inteligente, similar eforturilor recente din industrie care au identificat milioane în pierderi potențiale prin audituri automate.
Metrice de performanță: Măsoară capacitățile de "supraviețuire și căutare a adevărului", mergând dincolo de finalizarea simplă a sarcinilor pentru a asigura că agenții pot opera în siguranță fără "ghicire" sau "încercări și erori" în piețele financiare.
Anthropic
Anthropic
+4
Contextul industriei
Lansarea urmează unei serii de dezvoltări în domeniul securității AI la începutul anului 2026:
Economia agenților AI: Creșterea agenților AI "crypto" autonomi a necesitat noi standarde pentru gestionarea identității și protocoale "Zero Trust" pentru a preveni injectarea de prompturi prin API-uri.
Peisajul competitiv: Concurenți precum Anthropic au lansat, de asemenea, benchmark-uri axate pe securitate (de exemplu, SCONE-bench) pentru a cuantifica valoarea totală a fondurilor simulate furate, împingând industria către audituri automate mai robuste.
Expansiunea OpenAI: Această concentrare pe securitate se aliniază cu foaia de parcurs mai largă a OpenAI pentru 2026, care include dezvoltarea agenților personali de nouă generație în urma achiziției de talente cheie din proiectul OpenClaw
#OpenAI #CryptoSecurity #SmartContracts #OpenClawFounderJoinsOpenAI #Web3AI