Được viết bởi Đội ngũ Khoa học Qubic

NeuromodulationHọc viện Trí thông minh Neuraxon — Tập 3

Qubic Neuraxon Mood Mixer interactive demo showing four neuromodulators — dopamine, serotonin, acetylcholine, and norepinephrine — used in brain-inspired AI neuromodulation

1. Neuromodulation trong Não: Nền tảng của Trí thông minh Thích ứng

Neuromodulation đề cập đến tập hợp các cơ chế điều chỉnh cách mà hệ thần kinh hoạt động tại bất kỳ thời điểm nào, mà không thay đổi kiến trúc cơ bản của nó. Nhờ vào neuromodulation, não có thể học nhanh hoặc chậm, trở nên khám phá hoặc bảo thủ, và vẫn mở lòng với sự mới mẻ hoặc tập trung vào những gì đã được biết. Cách kết nối không thay đổi; điều thay đổi là cách mà cách kết nối đó được sử dụng. Khái niệm này là trung tâm để hiểu về AI lấy cảm hứng từ não và kiến trúc phía sau Neuraxon của Qubic.

Các Thụ Thể Ionotropic so với Metabotropic: Hai Thời Gian của Tín Hiệu Nơron

Để hiểu rõ về điều chỉnh thần kinh, cần phân biệt giữa hai hình thức tác động hóa học trong não. Một mặt, có các chất truyền dẫn thần kinh tác động lên các thụ thể ionotropic, như glutamate và GABA. Các thụ thể này là kênh ion: khi chúng được kích hoạt, chúng tạo ra những thay đổi điện tức thời trong nơron, ở quy mô mili giây. Điều này tương ứng với mức độ tính toán nơron nhanh: thông tin cụ thể được truyền tải, tín hiệu cảm giác được tích hợp, quyết định nhanh chóng được đưa ra, và hoạt động nơron duy trì cảm nhận, chuyển động, và suy nghĩ theo thời gian thực được tạo ra.

Mặt khác, có các chất truyền dẫn thần kinh như dopamine, noradrenaline, serotonin và acetylcholine, có tác động chính được thực hiện thông qua các thụ thể metabotropic. Các thụ thể này không trực tiếp tạo ra tín hiệu điện. Thay vào đó, chúng kích hoạt các chuỗi tín hiệu nội bào làm thay đổi các thuộc tính bên trong của nơron trong thời gian dài hơn, từ giây, phút, hoặc hơn thế. Điều này đại diện cho mức độ động lực chậm của quá trình xử lý thần kinh, điều này là cơ bản cho cách não thích ứng và học hỏi.

Một cách trực quan để nghĩ về sự khác biệt này là thông qua phép ẩn dụ của một cảng biển. Các thụ thể ionotropic giống như những người bơi lội, lướt ván, hoặc những chiếc thuyền nhỏ nhanh chóng vào và ra. Ngược lại, các thụ thể metabotropic giống như những con tàu hàng lớn. Để chúng có thể đậu, cần có giấy phép, cần có sự phối hợp, và cần điều chỉnh hậu cần của cảng. Những thụ thể metabotropic này thay đổi tính dẻo synap và sự dễ dàng mà một nơron phản ứng—sự điều chỉnh chậm này không truyền tải thông tin, mà thay vào đó điều chỉnh các quy tắc nội bộ của hệ thống.

Bốn Chất Điều Chỉnh Thần Kinh: Dopamine, Noradrenaline, Serotonin và Acetylcholine

Đây là nơi các hệ thống điều chỉnh thần kinh chính phát huy vai trò. Mỗi chất truyền dẫn thần kinh này đóng một vai trò riêng biệt trong việc điều chỉnh cách não xử lý thông tin, học hỏi, và thích ứng:

Dopamine, chủ yếu bắt nguồn từ khu vực tegmental bụng và chất đen, không báo hiệu sự thoải mái mà là khi điều gì đó có liên quan đến việc học. Nó điều chỉnh độ nhạy của hệ thống đối với lỗi và sự mới mẻ. Như Schultz (2016) đã chứng minh trong công trình nền tảng của ông về mã hóa lỗi dự đoán phần thưởng dopamine, dopamine báo hiệu sự khác biệt giữa kết quả dự kiến và thực tế, một cơ chế quan trọng cho việc học củng cố trong cả hệ thống sinh học và nhân tạo.

Noradrenaline (Norepinephrine), chủ yếu được phóng thích từ locus coeruleus, điều chỉnh sự hưng phấn và sự cân bằng giữa khám phá và khai thác. Khi âm lượng của nó cao, não trở nên nhạy cảm hơn với những thay đổi bất ngờ và ít bị ràng buộc vào thói quen. Điều này phù hợp với lý thuyết tích hợp do Aston-Jones & Cohen (2005) đề xuất, liên kết chức năng locus coeruleus–norepinephrine với việc kiểm soát lợi ích thích ứng và ra quyết định trong điều kiện không chắc chắn.

Serotonin, bắt nguồn từ các nhân raphe, điều chỉnh tâm trạng, giấc ngủ, sự ức chế và sự ổn định hành vi. Như đã được khám phá trong Dayan & Huys (2009), serotonin không thúc đẩy hệ thống học hỏi nhanh chóng, mà là để chờ đợi, tránh các phản ứng bốc đồng, và duy trì hành vi khi môi trường không chắc chắn. Nó đóng vai trò quan trọng trong sự kiên nhẫn và lập kế hoạch dài hạn.

Acetylcholine, được phóng thích từ các nhân vỏ não ở thân não, đóng vai trò trung tâm trong sự chú ý và học tập phụ thuộc vào ngữ cảnh. Nó tạo điều kiện cho việc mở các mạng vỏ não đối với thông tin cảm giác có liên quan và cho phép tính dẻo synap khi môi trường yêu cầu. Nó đặc biệt quan trọng khi có điều gì mới cần được học, làm cho nó trở thành điều thiết yếu cho tính toán nơron thích ứng.

Nhờ vào hành động kết hợp này, cùng một kích thích có thể tạo ra những phản ứng khác nhau tùy thuộc vào trạng thái điều chỉnh thần kinh. Mạch là như nhau, nhưng cách nó hoạt động đã thay đổi. Đây là lý do tại sao não không phản ứng theo cùng một cách khi nó tỉnh táo như khi nó mệt mỏi, cũng như nó không học theo cùng một cách trong các tình huống thường lệ như khi nó đối mặt với sự mới mẻ hoặc bất ngờ.

Cấp Độ Meta: Các Cửa Sổ Tính Dẻo và Học Tập Thích Ứng

Cũng có một cấp độ thứ ba, sâu hơn, có thể được hiểu như một cấp độ meta của điều chỉnh nơron. Cấp độ này không điều chỉnh trực tiếp hoạt động nơron hoặc tốc độ của nó, mà là điều kiện mà hệ thống có thể thay đổi theo cách lâu dài. Trong não, hoạt động đồng thời giữa các nơron không đảm bảo việc học. Để một kết nối được củng cố hoặc yếu đi, trạng thái điều chỉnh thần kinh phải cho phép điều đó. Giống như có một tín hiệu im lặng nói rằng, "bây giờ có", hoặc "bây giờ không".

Do đó, điều chỉnh thần kinh hoạt động như một hệ thống mở hoặc đóng các cửa sổ tính dẻo, quyết định khi nào một lỗi, một trải nghiệm, hoặc một sự trùng hợp xứng đáng được củng cố. Kiến trúc đa quy mô này, nhanh, chậm và meta, tồn tại vì một hệ thống thông minh không thể lúc nào cũng áp dụng cùng một quy tắc. Như Marder (2012) đã giải thích trong bài đánh giá mang tính bước ngoặt của cô, điều chỉnh thần kinh của các mạch nơron là cách não đạt được sự linh hoạt hành vi mà không cần xây dựng lại kiến trúc của nó.

Trạng thái của cơ thể, mức năng lượng, mệt mỏi hoặc đau đớn là một phần của môi trường nội bộ. Sự mới mẻ, mối đe dọa, cơ hội, sự lặp lại, hoặc khả năng đoán trước là một phần của môi trường bên ngoài. Các hệ thống điều chỉnh thần kinh dịch nghĩa những điều kiện này thành các trạng thái chức năng. Thông qua dopamine, noradrenaline, serotonin, và acetylcholine, não đánh giá xem một tình huống có xứng đáng để học hay không, liệu có cần thận trọng hay không, liệu khám phá hay bảo tồn là điều ưu tiên, và liệu một lỗi có thông tin hay chỉ là tiếng ồn. Môi trường không trực tiếp quyết định phản ứng, nhưng nó điều chỉnh các quy tắc mà não phản ứng. Nguyên tắc này nằm ở trung tâm của những gì Friston (2010) mô tả như nguyên tắc năng lượng tự do, một khung thống nhất gợi ý rằng não liên tục giảm thiểu sự bất ngờ thông qua các mô hình nội bộ thích ứng.

Brain diagram illustrating the biosynthesis pathways of key neuromodulators including dopamine from L-Tyrosine, noradrenaline from adrenaline, and serotonin from tryptophan, showing their origins in the brain

2. Tại Sao Các Mô Hình Ngôn Ngữ Lớn và Các Kiến Trúc Transformer Thiếu Điều Chỉnh Thần Kinh

Các mô hình ngôn ngữ lớn (LLMs) và các kiến trúc dựa trên Transformer không có khả năng điều chỉnh thần kinh. Mặc dù chúng xử lý các chuỗi dài và đã đạt được hiệu suất đáng kể trong xử lý ngôn ngữ tự nhiên, nhưng chúng thiếu một hệ thống điều chỉnh động chế độ hoạt động của mô hình trong quá trình suy diễn.

Bản Chất Tĩnh của Các Hệ Thống AI Dựa Trên Transformer

Việc học trong LLMs diễn ra trong các giai đoạn đào tạo hoàn toàn tách biệt với việc sử dụng. Các trọng số được điều chỉnh thông qua việc lan truyền lỗi, và khi việc đào tạo kết thúc, mô hình bước vào trạng thái cố định. Trong quá trình suy diễn, không có tính dẻo dai và không có thay đổi lâu dài như một chức năng của ngữ cảnh. Hệ thống không quyết định khi nào là thích hợp để học và khi nào nó nên ổn định, vì nó không học trong khi hoạt động. Đây là hạn chế cơ bản mà nghiên cứu gần đây đã xác nhận, LLMs thiếu các mô hình thế giới nội bộ thực sự và khả năng thích ứng theo thời gian thực.

Một số phương pháp lấy cảm hứng từ điều chỉnh thần kinh cố gắng xấp xỉ một số hiệu ứng nhất định bằng cách điều chỉnh các tham số như tốc độ học trong quá trình đào tạo, kích hoạt hoặc vô hiệu hóa các mạng con, hoặc điều chỉnh các hàm kích hoạt. Tuy nhiên, đây chỉ là những tối ưu hóa bên ngoài, không phải là các hệ thống nội bộ điều chỉnh hoạt động và tính dẻo dai theo thời gian thực. Như Mei, Müller & Ramaswamy (2022) đã lập luận trong Trends in Neurosciences, việc thông báo cho các mạng nơron sâu bằng các nguyên lý đa quy mô của các hệ thống điều chỉnh thần kinh vẫn là một thách thức mở, một thách thức mà các kiến trúc LLM hiện tại chưa giải quyết.

Mặc dù điều chỉnh thần kinh đôi khi được đề cập trong các ngữ cảnh AI, LLM và Transformer vẫn là những xấp xỉ một phần, không phải là những hệ thống có thể so sánh với não. Khoảng cách giữa các tính toán ma trận tĩnh và sự điều chỉnh động, phụ thuộc vào trạng thái được tìm thấy trong các mạng nơron sinh học chính xác là điều khiến các kiến trúc AI lấy cảm hứng từ não như Neuraxon trở thành bước đi cần thiết hướng tới trí tuệ nhân tạo thích ứng.

3. Cách Neuraxon Tính Toán Điều Chỉnh Thần Kinh: Kiến Trúc AI Lấy Cảm Hứng Từ Não

Trong Neuraxon, tính toán là một quá trình diễn ra trong thời gian liên tục. Mã thể hiện một hệ thống duy trì các trạng thái nội bộ, s(t), mà phát triển ngay cả khi không có kích thích bên ngoài rõ ràng. Những trạng thái này ảnh hưởng đến hành vi tương lai, tạo ra một hệ thống thần kinh sống động luôn hoạt động, một khái niệm được khám phá chi tiết trong tài liệu nghiên cứu Neuraxon.

Động lực Nhanh, Chậm và Meta trong Tính Toán Nơron

Neuraxon rõ ràng kết hợp động lực nhanh, chậm và meta, phản ánh kiến trúc tạm thời đa quy mô được tìm thấy trong não sinh học. Động lực nhanh điều khiển sự lan truyền ngay lập tức của hoạt động, tương tự như tín hiệu nơron nhanh chóng thông qua các thụ thể ionotropic. Động lực chậm giới thiệu sự tích lũy, kiên trì và ổn định của các mẫu, cho phép hệ thống giữ lại thông tin vượt ra ngoài khoảnh khắc, tương tự như cách các thụ thể metabotropic điều chỉnh chức năng nơron trong vài giây và phút. Động lực meta tác động đến các quy tắc tương tác giữa các yếu tố trước đó, điều chỉnh khi nào hệ thống trở nên nhạy cảm hơn với sự thay đổi và khi nào nó có xu hướng bảo tồn trạng thái của mình.

Điều chỉnh thần kinh trong Neuraxon không được thực hiện như một điều chỉnh tham số bên ngoài. Hệ thống không quyết định rõ ràng điều gì để học, mà là dưới điều kiện nào nó có thể thay đổi. Điều này phản ánh cách các chất điều chỉnh thần kinh sinh học như dopamine và serotonin tạo ra các cửa sổ tính dẻo thay vì mã hóa thông tin trực tiếp. Bạn có thể khám phá những động lực này trực tiếp với mô phỏng 3D tương tác của Neuraxon trên HuggingFace Spaces, nơi bạn có thể điều chỉnh mức độ dopamine, serotonin, acetylcholine và norepinephrine trong thời gian thực và quan sát cách chúng ảnh hưởng đến hành vi của mạng.

Từ Nguyên Tắc Sinh Học đến AI Phi Tập Trung

Cách tiếp cận này không tái tạo độ phức tạp phân tử hoặc giải phẫu của não, điều này hiện tại không thể sao chép. Không có hàng ngàn thụ thể hoặc mạng sinh học thực sự. Tuy nhiên, nó bảo tồn và tính toán một nguyên tắc thiết yếu: trí tuệ là có thể thích ứng, và do đó cần động lực nội bộ, trạng thái và điều chỉnh.

Kiến trúc điều chỉnh thần kinh của Neuraxon là một phần cốt lõi trong tầm nhìn rộng hơn của Qubic về AI phi tập trung. Bằng cách tích hợp Neuraxon với khung tiến hóa Aigarth Intelligent Tissue, Qubic tạo ra một hệ thống nơi hàng triệu kiến trúc dựa trên Neuraxon có thể phát triển, cạnh tranh, và cải thiện thông qua tính toán phân tán, được hỗ trợ bởi cơ chế đồng thuận Useful Proof of Work (UPoW) của mạng Qubic.

4. Khám Phá Các Chất Điều Chỉnh Thần Kinh với Bản Demo Tương Tác Neuraxon

Bạn có muốn trải nghiệm cách điều chỉnh thần kinh hoạt động trong một hệ thống AI lấy cảm hứng từ não không? Bản demo Neuraxon Mood Mixer cho phép bạn điều chỉnh mức độ dopamine, serotonin, acetylcholine và norepinephrine trong thời gian thực và quan sát cách những chất điều chỉnh thần kinh này ảnh hưởng đến hành vi của mạng nơron. Đây là một cách thực hành để hiểu các nguyên lý được thảo luận trong bài viết này và thấy sự khác biệt giữa tính toán AI tĩnh và xử lý động, phụ thuộc vào trạng thái.

5. Toán Học Đằng Sau Điều Chỉnh Thần Kinh Đa Quy Mô của Neuraxon

Các động lực tạm thời trong Neuraxon được điều chỉnh bởi ba phương trình vi phân nắm bắt các quy mô thời gian nhanh, chậm và meta của tính toán nơron:

The Mathematics Behind Neuraxon’s Multiscale Neuromodulation

Tại đây, τ_fast < τ_slow < τ_meta phản ánh các quy mô thời gian khác nhau của chúng, với τ_meta lớn hơn đáng kể để nắm bắt bản chất "cực chậm" của các hiệu ứng metabotropic. Khung toán học này thực hiện trực tiếp nguyên tắc sinh học rằng điều chỉnh thần kinh hoạt động trên các quy mô thời gian chậm hơn nhiều so với truyền dẫn synaptic nhanh, như được mô tả bởi Northoff & Huang (2017) trong công trình của họ về cách mà động lực thời gian của não điều chỉnh ý thức.

Tài Liệu Khoa Học

  • Dayan, P., & Huys, Q. J. M. (2009). Serotonin, ức chế, và tâm trạng tiêu cực. PLoS Computational Biology.

  • Marder, E. (2012). Điều chỉnh thần kinh của các mạch nơron: trở lại tương lai. Neuron.

  • Schultz, W. (2016). Mã hóa lỗi dự đoán phần thưởng dopamine. Dialogues in Clinical Neuroscience.

  • Aston-Jones, G., & Cohen, J. D. (2005). Một lý thuyết tích hợp về chức năng locus coeruleus–norepinephrine. Annual Review of Neuroscience.

  • Mei, L., Müller, E., & Ramaswamy, S. (2022). Thông báo cho các mạng nơron sâu bằng các nguyên lý đa quy mô của các hệ thống điều chỉnh thần kinh. Trends in Neurosciences.

  • Friston, K. (2010). Nguyên tắc năng lượng tự do: một lý thuyết não thống nhất? Nature Reviews Neuroscience.

  • Northoff, G., & Huang, Z. (2017). Làm thế nào thời gian và không gian của não điều chỉnh ý thức và các rối loạn của nó? Consciousness and Cognition, 57, 1–10.

#UPoW #Neuraxon