OpenAI și Paradigm lansează EVMbench pentru a asigura economia AI-Crypto

Pe 18 februarie 2026, OpenAI și Paradigm au introdus EVMbench, un nou sistem de benchmarking conceput special pentru a evalua și asigura performanța agenților AI în cadrul ecosistemului Ethereum Virtual Machine (EVM).

Bankless

Bankless

+1

Prezentare generală a EVMbench

Acest benchmark abordează nevoia în creștere de siguranță și fiabilitate pe măsură ce agenții AI autonomi sunt utilizați din ce în ce mai mult pentru a gestiona tokenuri crypto și a executa contracte inteligente.

arXiv

arXiv

+1

Securitate țintită: Oferă un cadru standardizat pentru a testa cât de bine pot manevra modelele AI în medii blockchain cu mize mari și adversariale.

Detectarea vulnerabilităților: Sistemul evaluează capacitatea unui agent de a identifica exploatările contractelor inteligente, similar eforturilor recente din industrie care au identificat milioane în pierderi potențiale prin audituri automate.

Metrice de performanță: Măsoară capacitățile de "supraviețuire și căutare a adevărului", mergând dincolo de finalizarea simplă a sarcinilor pentru a asigura că agenții pot opera în siguranță fără "ghicire" sau "încercări și erori" în piețele financiare.

Anthropic

Anthropic

+4

Contextul industriei

Lansarea urmează unei serii de dezvoltări în domeniul securității AI la începutul anului 2026:

Economia agenților AI: Creșterea agenților AI "crypto" autonomi a necesitat noi standarde pentru gestionarea identității și protocoale "Zero Trust" pentru a preveni injectarea de prompturi prin API-uri.

Peisajul competitiv: Concurenți precum Anthropic au lansat, de asemenea, benchmark-uri axate pe securitate (de exemplu, SCONE-bench) pentru a cuantifica valoarea totală a fondurilor simulate furate, împingând industria către audituri automate mai robuste.

Expansiunea OpenAI: Această concentrare pe securitate se aliniază cu foaia de parcurs mai largă a OpenAI pentru 2026, care include dezvoltarea agenților personali de nouă generație în urma achiziției de talente cheie din proiectul OpenClaw

#OpenAI #CryptoSecurity #SmartContracts #OpenClawFounderJoinsOpenAI #Web3AI