Aprendizaje por Refuerzo: El Cambio de Paradigma de la IA Descentralizada
Autor: 0xjacobzhao | https://linktr.ee/0xjacobzhao Este informe de investigación independiente es apoyado por IOSG Ventures. El proceso de investigación y escritura fue inspirado por el trabajo de Sam Lehman (Pantera Capital) sobre el aprendizaje por refuerzo. Gracias a Ben Fielding (Gensyn.ai), Gao Yuan (Gradient), Samuel Dare & Erfan Miahi (Covenant AI), Shashank Yadav (Fraction AI), Chao Wang por sus valiosas sugerencias sobre este artículo. Este artículo busca la objetividad y precisión, pero algunos puntos de vista implican juicio subjetivo y pueden contener sesgos. Agradecemos la comprensión de los lectores.
Este informe independiente es respaldado por IOSG Ventures, el proceso de investigación y escritura fue inspirado por el informe de aprendizaje reforzado de Sam Lehman (Pantera Capital), agradeciendo a Ben Fielding (Gensyn.ai), Gao Yuan (Gradient), Samuel Dare & Erfan Miahi (Covenant AI), Shashank Yadav (Fraction AI), Chao Wang por sus valiosos comentarios sobre este artículo. Este documento busca ser objetivo y preciso, y algunas opiniones involucran juicios subjetivos, por lo que no se puede evitar que existan sesgos, agradecemos la comprensión del lector. La inteligencia artificial está pasando de un aprendizaje estadístico centrado en "ajuste de patrones" a un sistema de capacidades centrado en "razonamiento estructurado", con la importancia del entrenamiento posterior (Post-training) aumentando rápidamente. La aparición de DeepSeek-R1 marca un cambio de paradigma para el aprendizaje reforzado en la era de grandes modelos, formando un consenso en la industria: el preentrenamiento establece la base de capacidades generales del modelo, el aprendizaje reforzado ya no es solo una herramienta de alineación de valores, sino que ha demostrado que puede mejorar sistemáticamente la calidad de las cadenas de inferencia y la capacidad de toma de decisiones complejas, evolucionando gradualmente hacia una trayectoria técnica para mejorar continuamente el nivel de inteligencia.
Este informe de investigación independiente es apoyado por IOSG Ventures. El proceso de investigación y redacción fue inspirado por trabajos relacionados de Raghav Agarwal (LongHash) y Jay Yu (Pantera). Agradecimientos a Lex Sokolin @ Generative Ventures, Jordan@AIsa, Ivy @PodOur2Cents por sus valiosas sugerencias sobre este artículo. También se solicitó retroalimentación de equipos de proyectos como Nevermined, Skyfire, Virtuals Protocol, AIsa, Heurist, AEON durante el proceso de redacción. Este artículo se esfuerza por un contenido objetivo y preciso, pero algunos puntos de vista involucran juicio subjetivo y pueden contener desviaciones inevitablemente. Se aprecia la comprensión de los lectores.
Este informe de investigación independiente contó con el apoyo de IOSG Ventures. El proceso de investigación y redacción se inspiró en los informes de Raghav Agarwal (@LongHash) y Jay Yu (@Pantera). Agradecemos a Lex Sokolin (@Generative Ventures), Jordan (@AIsa) e Ivy (@支无不言) sus valiosas sugerencias. También se solicitó la opinión de los equipos de proyecto de Nevermined, Skyfire, Virtuals Protocol, AIsa, Heurist y AEON. Si bien buscamos la objetividad y la precisión, algunos puntos de vista implican juicios subjetivos y pueden contener sesgos; solicitamos la comprensión del lector.
La evolución convergente de la automatización, la IA y Web3 en la industria de la robótica
Autor: 0xjacobzhao | https://linktr.ee/0xjacobzhao Este informe de investigación independiente es apoyado por IOSG Ventures. El autor agradece a Hans (RoboCup Asia-Pacífico), Nichanan Kesonpat(1kx), Robert Koschig (1kx), Amanda Young (Collab+Currency), Jonathan Victor (Ansa Research), Lex Sokolin (Generative Ventures), Jay Yu (Pantera Capital), Jeffrey Hu (Hashkey Capital) por sus valiosos comentarios, así como a los contribuyentes de OpenMind, BitRobot, peaq, Auki Labs, XMAQUINA, GAIB, Vader, Gradient, Tashi Network y CodecFlow por sus comentarios constructivos. Si bien se ha hecho todo lo posible para garantizar la objetividad y precisión, algunas percepciones inevitablemente reflejan una interpretación subjetiva, y se alienta a los lectores a interactuar con el contenido de manera crítica.
Este informe independiente es apoyado por IOSG Ventures, agradecimientos a Hans (RoboCup Asia-Pacífico), Nichanan Kesonpat (1kx), Robert Koschig (1kx), Amanda Young (Collab+Currency), Jonathan Victor (Ansa Research), Lex Sokolin (Generative Ventures), Jay Yu (Pantera Capital), Jeffrey Hu (Hashkey Capital) por sus valiosas sugerencias sobre este artículo. Durante la redacción también se consultó a los equipos de proyectos como OpenMind, BitRobot, peaq, Auki Labs, XMAQUINA, GAIB, Vader, Gradient, Tashi Network y CodecFlow. Este artículo se esfuerza por ser objetivo y preciso, algunas opiniones implican juicios subjetivos, lo que puede llevar a sesgos, pedimos a los lectores que lo comprendan.
Informe de Investigación de Brevis: La Capa Infinita de Computación Verificable de zkVM y zkCoprocesador de Datos ZK
El paradigma de la Computación Verificable — "cómputo fuera de cadena + verificación en cadena" — se ha convertido en el modelo computacional universal para sistemas blockchain. Permite que las aplicaciones blockchain logren una libertad computacional casi infinita mientras mantienen la descentralización y la ausencia de confianza como garantías de seguridad fundamentales. Las pruebas de conocimiento cero (ZKPs) forman la columna vertebral de este paradigma, con aplicaciones principalmente en tres direcciones fundamentales: escalabilidad, privacidad e interoperabilidad & integridad de datos. La escalabilidad fue la primera aplicación ZK en alcanzar la producción, moviendo la ejecución fuera de la cadena y verificando pruebas concisas en la cadena para una alta capacidad y una escalabilidad sin confianza de bajo costo.
Informe Brevis: Capa de computación confiable infinita de ZKVM y procesadores de datos
El paradigma de "Cálculo fuera de la cadena + Verificación en la cadena" (Verifiable Computing) se ha convertido en el modelo de computación general para los sistemas de blockchain. Permite que las aplicaciones de blockchain obtengan casi una libertad de cálculo ilimitada (computational freedom) mientras mantienen la descentralización y la minimización de la confianza (trustlessness) en términos de seguridad. Las pruebas de conocimiento cero (ZKP) son el pilar central de este paradigma, y su aplicación se centra principalmente en tres direcciones básicas: escalabilidad (Scalability), privacidad (Privacy) e interoperabilidad e integridad de datos (Interoperability & Data Integrity). Entre ellas, la escalabilidad es el escenario donde la tecnología ZK se implementó por primera vez, logrando una escalabilidad confiable de alto TPS y bajo costo al trasladar la ejecución de transacciones fuera de la cadena y verificar los resultados con pruebas breves en la cadena.
Informe de Investigación Cysic: El Camino ComputeFi de la Aceleración de Hardware ZK
Autor:0xjacobzhao | https://linktr.ee/0xjacobzhao Pruebas de Conocimiento Cero (ZK) — como una infraestructura criptográfica y de escalabilidad de próxima generación — están demostrando un inmenso potencial en el escalado de blockchain, computación de privacidad, zkML y verificación entre cadenas. Sin embargo, el proceso de generación de pruebas es extremadamente intensivo en cómputo y pesado en latencia, formando el mayor cuello de botella para la adopción industrial. La aceleración de hardware ZK ha surgido, por lo tanto, como un habilitador clave. Dentro de este panorama, las GPU destacan en versatilidad y velocidad de iteración, los ASICs persiguen la máxima eficiencia y rendimiento a gran escala, mientras que los FPGAs sirven como un terreno intermedio flexible que combina programabilidad con eficiencia energética. Juntos, forman la base de hardware que impulsa la adopción del mundo real de ZK.
Informe de Cysic: El camino de ComputeFi para la aceleración de hardware ZK
Autor: 0xjacobzhao | https://linktr.ee/0xjacobzhao Las pruebas de conocimiento cero (ZK) como una nueva generación de infraestructura de cifrado y escalado, han mostrado un amplio potencial en aplicaciones emergentes como la escalabilidad de blockchain, computación privada y zkML, validaciones entre cadenas, entre otros. Sin embargo, el proceso de generación de pruebas requiere una gran cantidad de cálculo y tiene altas latencias, lo que se convierte en el mayor cuello de botella para la industrialización. La aceleración de hardware ZK ha surgido como un eslabón central en este contexto. En el camino de aceleración de hardware ZK, las GPU se destacan por su versatilidad y velocidad de iteración, los ASIC persiguen una eficiencia energética extrema y un rendimiento escalable, mientras que los FPGA, como una forma intermedia, combinan flexibilidad programable con alta eficiencia energética. Juntos, estos tres componentes forman la base de hardware que impulsa la implementación de pruebas de conocimiento cero.
Informe de Investigación de GAIB: La Financiarización en Cadena de la Infraestructura de IA — RWAiFi
Escrito por 0xjacobzhao | https://linktr.ee/0xjacobzhao A medida que la IA se convierte en la ola tecnológica de más rápido crecimiento, el poder de computación se ve como una nueva “moneda”, con las GPU convirtiéndose en activos estratégicos. Sin embargo, la financiación y la liquidez siguen siendo limitadas, mientras que las finanzas criptográficas necesitan activos respaldados por flujo de efectivo real. La tokenización de RWA está surgiendo como el puente. La infraestructura de IA, que combina hardware de alto valor + flujos de efectivo predecibles, se considera el mejor punto de entrada para RWAs no estándar: las GPU ofrecen practicidad a corto plazo, mientras que la robótica representa la frontera a largo plazo. RWAiFi de GAIB (RWA + IA + DeFi) introduce un nuevo camino hacia la financiarización en cadena, potenciando el volante de infraestructura de IA (GPU & Robótica) × RWA × DeFi.
Informe de GAIB: El camino de la financiación en cadena de la infraestructura de IA - RWAiFi
Autor: 0xjacobzhao | https://linktr.ee/0xjacobzhao A medida que la IA se convierte en la ola tecnológica de crecimiento más rápida a nivel mundial, la potencia de cálculo es vista como una nueva "moneda", y hardware de alto rendimiento como las GPU está evolucionando gradualmente hacia activos estratégicos. Sin embargo, durante mucho tiempo, la financiación y liquidez de estos activos ha estado limitada. Al mismo tiempo, las finanzas criptográficas necesitan acceder a activos de alta calidad con flujo de efectivo real, y la tokenización de RWA (Activos del Mundo Real) se está convirtiendo en un puente clave que conecta las finanzas tradicionales con el mercado criptográfico. Los activos de infraestructura de IA, gracias a las características de "hardware de alto valor + flujo de efectivo predecible", son generalmente considerados como la mejor vía de ruptura para los activos RWA no estándar, donde las GPU tienen el potencial más realista de implementación, mientras que los robots representan una dirección de exploración a más largo plazo. En este contexto, la ruta RWAiFi (RWA + IA + DeFi) propuesta por GAIB proporciona una nueva solución para el "camino de la financiación en cadena de la infraestructura de IA", impulsando el efecto de rueda de inercia de "infraestructura de IA (potencia de cálculo y robots) x RWA x DeFi".
Del Aprendizaje Federado a las Redes de Agentes Descentralizados: Un Análisis sobre ChainOpera
Escrito por 0xjacobzhao | https://linktr.ee/0xjacobzhao En nuestro informe de junio “El Santo Grial de Crypto AI: Exploración Fronteriza del Entrenamiento Descentralizado”, discutimos el Aprendizaje Federado—un paradigma de “descentralización controlada” posicionado entre el entrenamiento distribuido y el entrenamiento completamente descentralizado. Su principio fundamental es mantener los datos locales mientras se agregan parámetros de forma central, un diseño particularmente adecuado para industrias sensibles a la privacidad y con alta conformidad como la atención médica y las finanzas.
De Aprendizaje Federado a Red de Agentes Descentralizados: Análisis del Proyecto ChainOpera
En el informe de junio (El Santo Grial de Crypto AI: Exploración de vanguardia en entrenamiento descentralizado), mencionamos el aprendizaje federado (Federated Learning), una solución de "descentralización controlada" que se sitúa entre el entrenamiento distribuido y el entrenamiento descentralizado: su núcleo es la retención local de datos, la agregación centralizada de parámetros, satisfaciendo las necesidades de privacidad y cumplimiento en sectores como la salud y las finanzas. Al mismo tiempo, hemos seguido prestando atención a la aparición de redes de agentes (Agent) en informes anteriores, donde su valor radica en completar tareas complejas a través de la autonomía y la división del trabajo de múltiples agentes, impulsando la evolución de los "grandes modelos" hacia un "ecosistema de múltiples agentes".
Informe de OpenLedge: La monetización de datos y modelos en la cadena de IA
I. Introducción | La transición de la capa de modelos de Crypto AI Los datos, modelos y potencia de cálculo son los tres elementos clave de la infraestructura de IA, análogos a combustible (datos), motor (modelo) y energía (potencia de cálculo), todos son imprescindibles. Al igual que la trayectoria de evolución de la infraestructura de la industria de IA tradicional, el campo de Crypto AI también ha pasado por etapas similares. A principios de 2024, el mercado estuvo dominado por proyectos de GPU descentralizados (Akash, Render, io.net, etc.), que enfatizaban la lógica de crecimiento extensivo de 'combinar potencia de cálculo'. Sin embargo, a partir de 2025, el enfoque de la industria ha comenzado a trasladarse gradualmente hacia el nivel de modelos y datos, marcando la transición de Crypto AI de la competencia por recursos de base a una construcción de nivel medio más sostenible y con valor de aplicación.
Informe de Investigación de OpenLedger: Una Cadena de IA para Datos y Modelos Monetizables
1. Introducción | El Cambio de Modelo-Capa en Crypto AI Los datos, los modelos y el cómputo forman los tres pilares centrales de la infraestructura de IA—comparables a combustible (datos), motor (modelo) y energía (cómputo)—todos indispensables. Al igual que la evolución de la infraestructura en la industria tradicional de IA, el sector de Crypto AI ha seguido una trayectoria similar. A principios de 2024, el mercado estaba dominado por proyectos de GPU descentralizados (como Akash, Render y io.net), caracterizados por un modelo de crecimiento que consume muchos recursos centrado en la potencia de cómputo cruda. Sin embargo, para 2025, la atención de la industria se ha desplazado gradualmente hacia las capas de modelo y datos, marcando una transición de la competencia de infraestructura de bajo nivel a un desarrollo de capa media más sostenible y orientado a aplicaciones.
Estrategias de Rendimiento de Pendle Reveladas: El Paradigma AgentFi de Pulse
Por 0xjacobzhao | https://linktr.ee/0xjacobzhao Sin duda, Pendle es uno de los protocolos DeFi más exitosos en el ciclo actual de criptomonedas. Mientras que muchos protocolos se han estancado debido a sequías de liquidez y narrativas que se desvanecen, Pendle se ha distinguido a través de su mecanismo único de división de rendimiento y trading, convirtiéndose en el “lugar de descubrimiento de precios” para activos generadores de rendimiento. Al integrarse profundamente con stablecoins, LSTs/LRTs y otros activos generadores de rendimiento, ha asegurado su posicionamiento como la “infraestructura de tasa de rendimiento DeFi” fundamental.
De zkVM a Open Proof Market: Un análisis de RISC Zero y Boundless
En blockchain, la criptografía es la base fundamental de la seguridad y la confianza. Las Pruebas de Conocimiento Cero (ZK) pueden comprimir cualquier cálculo complejo fuera de la cadena en una prueba sucinta que puede ser verificada de manera eficiente en la cadena—sin depender de la confianza de terceros—mientras que también permite ocultar selectivamente entradas para preservar la privacidad. Con su combinación de verificación eficiente, universalidad y privacidad, ZK se ha convertido en una solución clave en los casos de uso de escalado, privacidad e interoperabilidad. Aunque quedan desafíos, como el alto costo de generación de pruebas y la complejidad del desarrollo de circuitos, la viabilidad de ingeniería de ZK y el grado de adopción ya han superado otros enfoques, convirtiéndolo en el marco más adoptado para el cálculo de confianza.
Informe de Investigación Almanak: El Camino Inclusivo de las Finanzas Cuantitativas On-Chain
En nuestro informe de investigación anterior “La Evolución Inteligente de DeFi: De la Automatización a AgentFi”, mapeamos y comparamos sistemáticamente las tres etapas del desarrollo de la inteligencia DeFi: Automatización, Copiloto Centrado en la Intención, y AgentFi. Señalamos que una porción significativa de los proyectos DeFAI actuales todavía centra sus capacidades fundamentales en transacciones de intercambio “impulsadas por la intención + interacción atómica única”. Dado que estas interacciones no implican estrategias de rendimiento continuas, no requieren gestión del estado y no necesitan un marco de ejecución complejo, son más adecuadas para copilotos basados en la intención y no pueden clasificarse estrictamente como AgentFi.
La Evolución Inteligente de DeFi: Desde la Automatización hasta AgentFi
Este documento se benefició de las sugerencias perspicaces de Lex Sokolin (Generative Ventures), Stepan Gershuni (cyber.fund) y Advait Jayant (Aivos Labs), junto con valiosas aportaciones de los equipos detrás de Giza, Theoriq, Olas, Almanak, Brahma.fi y HeyElsa. Si bien se han realizado esfuerzos para garantizar objetividad y precisión, ciertas perspectivas pueden reflejar interpretaciones personales. Se anima a los lectores a involucrarse críticamente con el contenido. Entre los diversos sectores en el actual paisaje cripto, los pagos con stablecoin y las aplicaciones DeFi destacan como dos verticales con demanda real verificada y valor a largo plazo. Al mismo tiempo, el floreciente desarrollo de Agentes de IA está surgiendo como la interfaz práctica de cara al usuario de la industria de IA, actuando como un intermediario clave entre la IA y los usuarios.
Inicia sesión para explorar más contenidos
Descubre las últimas noticias sobre criptomonedas
⚡️ Participa en los debates más recientes sobre criptomonedas