Escrito por el equipo científico de Qubic

NeuromodulationAcademia de Inteligencia Neuraxon — Volumen 3

Qubic Neuraxon Mood Mixer interactive demo showing four neuromodulators — dopamine, serotonin, acetylcholine, and norepinephrine — used in brain-inspired AI neuromodulation

1. Neuromodulación en el cerebro: La base de la inteligencia adaptativa

La neuromodulación se refiere al conjunto de mecanismos que regulan cómo funciona el sistema nervioso en un momento dado, sin cambiar su arquitectura básica. Gracias a la neuromodulación, el cerebro puede aprender rápida o lentamente, volverse exploratorio o conservador, y permanecer abierto a la novedad o centrarse en lo que ya se conoce. El cableado no cambia; lo que cambia es la forma en que se utiliza ese cableado. Este concepto es central para comprender la IA inspirada en el cerebro y la arquitectura detrás de Neuraxon de Qubic.

Receptores Ionotrópicos vs. Metabotrópicos: Dos Escalas de Tiempo de Señalización Neural

Para entender la neuromodulación correctamente, es esencial distinguir entre dos formas de acción química en el cerebro. Por un lado, están los neurotransmisores que actúan sobre receptores ionotrópicos, como el glutamato y el GABA. Estos receptores son canales iónicos: cuando se activan, producen cambios eléctricos inmediatos en la neurona, en la escala de milisegundos. Esto corresponde al nivel rápido de la computación neural: se transmite información concreta, se integran señales sensoriales, se toman decisiones rápidas y se genera la actividad neuronal que sostiene la percepción, el movimiento y el pensamiento en tiempo real.

Por otro lado, hay neurotransmisores como la dopamina, la noradrenalina, la serotonina y la acetilcolina, cuya acción principal se ejerce a través de receptores metabotrópicos. Estos receptores no generan directamente una señal eléctrica. En su lugar, activan cascadas de señalización intracelular que modifican las propiedades internas de la neurona durante períodos de tiempo más largos, segundos, minutos o más. Esto representa el nivel dinámico lento del procesamiento neural, que es fundamental para cómo el cerebro se adapta y aprende.

Una forma intuitiva de pensar sobre esta diferencia es a través de la metáfora de un puerto marítimo. Los receptores ionotrópicos son como nadadores, surfistas o pequeños barcos que entran y salen rápidamente. Los receptores metabotrópicos, en cambio, son como grandes barcos de carga. Para que atracen, se necesitan permisos, se requiere coordinación y deben ajustarse las logísticas del puerto. Estos receptores metabotrópicos alteran la plasticidad sináptica y la facilidad con la que una neurona responde; esta modulación lenta no transmite información, sino que modifica las reglas internas del sistema.

Los Cuatro Neuromoduladores: Dopamina, Noradrenalina, Serotonina y Acetilcolina

Aquí es donde entran en juego los principales sistemas neuromoduladores. Cada uno de estos cuatro neurotransmisores juega un papel distinto en la regulación de cómo el cerebro procesa información, aprende y se adapta:

La dopamina, que se origina principalmente en el área tegmental ventral y la sustancia negra, no señala placer por sí mismo, sino más bien cuando algo es relevante para el aprendizaje. Ajusta la sensibilidad del sistema a errores y novedades. Como Schultz (2016) demostró en su trabajo fundamental sobre la codificación del error de predicción de recompensa de dopamina, la dopamina señala la diferencia entre los resultados esperados y los reales, un mecanismo crítico para el aprendizaje por refuerzo tanto en sistemas biológicos como artificiales.

La noradrenalina (norepinefrina), liberada principalmente desde el locus coeruleus, regula la excitación y el equilibrio entre exploración y explotación. Cuando su tono es alto, el cerebro se vuelve más sensible a cambios inesperados y menos anclado a rutinas. Esto se alinea con la teoría integrativa propuesta por Aston-Jones & Cohen (2005), que vincula la función del locus coeruleus-norepinefrina al control de ganancia adaptativa y la toma de decisiones bajo incertidumbre.

La serotonina, que se origina en los núcleos del rafe, modula el estado de ánimo, el sueño, la inhibición y la estabilidad conductual. Como se exploró en Dayan & Huys (2009), la serotonina no impulsa al sistema a aprender rápidamente, sino más bien a esperar, a evitar reacciones impulsivas y a mantener el comportamiento cuando el entorno es incierto. Juega un papel crítico en la paciencia y la planificación a largo plazo.

La acetilcolina, liberada desde los núcleos del forebrain basal en el tronco encefálico, juega un papel central en la atención y el aprendizaje dependiente del contexto. Facilita la apertura de redes corticales a información sensorial relevante y permite la plasticidad sináptica cuando el entorno lo exige. Es particularmente importante cuando algo nuevo debe ser aprendido, haciéndola esencial para la computación neural adaptativa.

Gracias a esta acción combinada, el mismo estímulo puede producir diferentes respuestas dependiendo del estado neuromodulatorio. El circuito es el mismo, pero la forma en que opera ha cambiado. Por eso el cerebro no responde de la misma manera cuando está atento que cuando está fatigado, ni aprende de la misma manera en situaciones rutinarias que ante la novedad o la sorpresa.

El Nivel Meta: Ventanas de Plasticidad y Aprendizaje Adaptativo

También hay un tercer nivel, más profundo, que puede entenderse como un nivel meta de regulación neuronal. Este nivel no regula directamente la actividad neuronal ni su velocidad, sino más bien las condiciones bajo las cuales el sistema puede cambiar de manera duradera. En el cerebro, la actividad coincidente entre neuronas no garantiza el aprendizaje. Para que una conexión se fortalezca o debilite, el estado neuromodulatorio debe permitirlo. Es como si hubiera una señal silenciosa que dice: “ahora sí”, o “ahora no”.

La neuromodulación, por lo tanto, actúa como un sistema que abre o cierra ventanas de plasticidad, decidiendo cuándo un error, una experiencia o una coincidencia merece ser consolidada. Esta arquitectura multiescala, rápida, lenta y meta, existe porque un sistema inteligente no puede aplicar siempre las mismas reglas. Como explicó Marder (2012) en su revisión seminal, la neuromodulación de circuitos neuronales es cómo el cerebro logra flexibilidad conductual sin reconstruir su arquitectura.

El estado del cuerpo, los niveles de energía, la fatiga o el dolor son parte del entorno interno. La novedad, la amenaza, la oportunidad, la repetición o la predictibilidad son parte del entorno externo. Los sistemas neuromoduladores traducen estas condiciones en estados funcionales. A través de la dopamina, la noradrenalina, la serotonina y la acetilcolina, el cerebro evalúa si una situación merece ser aprendida, si se requiere precaución, si la exploración o la conservación son preferibles, y si un error es informativo o simplemente ruido. El entorno no dicta directamente la respuesta, sino que modula las reglas por las cuales el cerebro responde. Este principio está en el corazón de lo que Friston (2010) describió como el principio de energía libre, un marco unificado que sugiere que el cerebro minimiza continuamente la sorpresa a través de modelos internos adaptativos.

Brain diagram illustrating the biosynthesis pathways of key neuromodulators including dopamine from L-Tyrosine, noradrenaline from adrenaline, and serotonin from tryptophan, showing their origins in the brain

2. Por Qué los Modelos de Lenguaje Grandes y las Arquitecturas de Transformers Carecen de Neuromodulación

Los modelos de lenguaje grandes (LLMs) y las arquitecturas basadas en Transformers no poseen neuromodulación. Aunque procesan secuencias largas y han logrado un rendimiento notable en el procesamiento del lenguaje natural, carecen de un sistema que regule dinámicamente el régimen operativo del modelo durante la inferencia.

La Naturaleza Estática de los Sistemas de IA Basados en Transformers

El aprendizaje en LLMs ocurre durante fases de entrenamiento que son completamente separadas del uso. Los pesos se ajustan a través de la retropropagación del error, y una vez que se completa el entrenamiento, el modelo entra en un estado fijo. Durante la inferencia, no hay plasticidad y no hay cambio duradero como función del contexto. El sistema no decide cuándo es apropiado aprender y cuándo debe estabilizarse, porque no aprende mientras opera. Esta es la limitación fundamental que la investigación reciente ha confirmado, los LLMs carecen de verdaderos modelos internos del mundo y de la capacidad de adaptarse en tiempo real.

Algunos enfoques inspirados en la neuromodulación intentan aproximar ciertos efectos ajustando parámetros como la tasa de aprendizaje durante el entrenamiento, activando o desactivando subredes, o modulando funciones de activación. Sin embargo, estas son meras optimizaciones externas, no sistemas internos que regulan la actividad y la plasticidad en tiempo real. Como argumentaron Mei, Müller & Ramaswamy (2022) en Trends in Neurosciences, informar a las redes neuronales profundas mediante principios multiescala de sistemas neuromodulatorios sigue siendo un desafío abierto, uno que las arquitecturas actuales de LLM no han abordado.

Aunque la neuromodulación a veces se menciona en contextos de IA, los LLMs y Transformers siguen siendo aproximaciones parciales, no sistemas comparables al cerebro. La brecha entre los cálculos matriciales estáticos y la regulación dinámica, dependiente del estado, que se encuentra en las redes neuronales biológicas es precisamente lo que hace que arquitecturas de IA inspiradas en el cerebro como Neuraxon sean un paso necesario hacia una inteligencia artificial adaptativa.

3. Cómo Neuraxon Computa la Neuromodulación: Arquitectura de IA Inspirada en el Cerebro

En Neuraxon, la computación es un proceso que se desarrolla en tiempo continuo. El código expresa un sistema que mantiene estados internos, s(t), que evolucionan incluso en ausencia de estímulos externos claros. Estos estados influyen en el comportamiento futuro, creando un sistema neural vivo que siempre está activo, un concepto explorado en detalle en el artículo de investigación de Neuraxon.

Dinámicas Rápidas, Lentas y Meta en la Computación Neural

Neuraxon incorpora explícitamente dinámicas rápidas, lentas y meta, reflejando la arquitectura temporal multiescala que se encuentra en el cerebro biológico. Las dinámicas rápidas gobiernan la propagación inmediata de la actividad, análogas a la señalización neuronal rápida a través de receptores ionotrópicos. Las dinámicas lentas introducen acumulación, persistencia y estabilización de patrones, permitiendo que el sistema retenga información más allá del instante, similar a cómo los receptores metabotrópicos modulan la función neural durante segundos y minutos. Las dinámicas meta actúan sobre las reglas de interacción entre los anteriores, modulando cuándo el sistema se vuelve más sensible al cambio y cuándo tiende a preservar su estado.

La neuromodulación en Neuraxon no se implementa como un ajuste de parámetros externo. El sistema no decide explícitamente qué aprender, sino más bien bajo qué condiciones puede cambiar. Esto refleja cómo los neuromoduladores biológicos como la dopamina y la serotonina crean ventanas de plasticidad en lugar de codificar información directamente. Puedes explorar estas dinámicas de primera mano con la simulación interactiva de Neuraxon 3D en HuggingFace Spaces, donde puedes ajustar los niveles de dopamina, serotonina, acetilcolina y norepinefrina en tiempo real y observar cómo afectan el comportamiento de la red.

De Principios Biológicos a IA Descentralizada

Este enfoque no reproduce la complejidad molecular o anatómica del cerebro, lo cual actualmente es imposible de replicar. No hay miles de receptores o redes biológicas reales. Sin embargo, preserva y computa un principio esencial: la inteligencia es adaptativa y, por lo tanto, requiere dinámicas internas, estado y modulación.

La arquitectura de neuromodulación de Neuraxon es una parte fundamental de la visión más amplia de Qubic para una IA descentralizada. Al integrar Neuraxon con el marco evolutivo de Tejido Inteligente Aigarth, Qubic crea un sistema donde millones de arquitecturas basadas en Neuraxon pueden evolucionar, competir y mejorar a través de la computación distribuida, impulsada por el mecanismo de consenso de Prueba de Trabajo Útil (UPoW) de la red Qubic.

4. Explora Neuromoduladores con la Demo Interactiva de Neuraxon

¿Quieres experimentar cómo funciona la neuromodulación en un sistema de IA inspirado en el cerebro? La demo Neuraxon Mood Mixer te permite ajustar los niveles de dopamina, serotonina, acetilcolina y norepinefrina en tiempo real y observar cómo estos neuromoduladores influyen en el comportamiento de la red neuronal. Es una forma práctica de entender los principios discutidos en este artículo y ver la diferencia entre el cálculo estático de IA y el procesamiento dinámico, dependiente del estado.

5. Las Matemáticas Detrás de la Neuromodulación Multiescala de Neuraxon

Las dinámicas temporales en Neuraxon están gobernadas por tres ecuaciones diferenciales que capturan las escalas de tiempo rápidas, lentas y meta de la computación neural:

The Mathematics Behind Neuraxon’s Multiscale Neuromodulation

Aquí, τ_fast < τ_slow < τ_meta reflejan sus escalas temporales distintas, siendo τ_meta significativamente mayor para capturar la naturaleza ‘ultraslenta’ de los efectos metabotrópicos. Este marco matemático implementa directamente el principio biológico de que la neuromodulación opera en escalas de tiempo mucho más lentas que la transmisión sináptica rápida, como lo describieron Northoff & Huang (2017) en su trabajo sobre cómo las dinámicas temporales del cerebro median la conciencia.

Referencias Científicas

  • Dayan, P., & Huys, Q. J. M. (2009). Serotonina, inhibición y estado de ánimo negativo. PLoS Computational Biology.

  • Marder, E. (2012). Neuromodulación de circuitos neuronales: de vuelta al futuro. Neuron.

  • Schultz, W. (2016). Codificación del error de predicción de recompensa de dopamina. Diálogos en Neurociencia Clínica.

  • Aston-Jones, G., & Cohen, J. D. (2005). Una teoría integrativa de la función del locus coeruleus–norepinefrina. Revisión Anual de Neurociencia.

  • Mei, L., Müller, E., & Ramaswamy, S. (2022). Informando a las redes neuronales profundas mediante principios multiescala de sistemas neuromodulatorios. Trends in Neurosciences.

  • Friston, K. (2010). ¿El principio de energía libre: una teoría unificada del cerebro? Nature Reviews Neuroscience.

  • Northoff, G., & Huang, Z. (2017). ¿Cómo median el tiempo y el espacio del cerebro la conciencia y sus trastornos? Conciencia y Cognición, 57, 1–10.

#UPoW #Neuraxon