En la actualidad, probablemente muchos hermanos estén ansiosos por saber cómo seguir el ritmo de la era de la IA

Quiero comenzar a aprender IA, pero todas estas cosas complejas son completamente incomprensibles

Esta vez comenzaremos desde lo más básico: ¿qué es la IA y qué es AIGC?

Con texto e ilustraciones, paso a paso llevaré a los hermanos a entender los fundamentos más básicos de la IA

Ayudando a los hermanos a emprender su propio camino en la IA~


⏩ Comenzaremos con el marco más grande de la IA, ¿qué es la IA?

La IA es la inteligencia artificial, que nació en 1956 en el ámbito de la informática como una gran disciplina

El objetivo es que los sistemas informáticos simulen la inteligencia humana para resolver problemas y completar tareas

⏩ Luego, ¿qué es el AIGC que se menciona más recientemente?

AIGC = contenido generado por IA

En pocas palabras: cualquier contenido generado por IA se llama AIGC

  • Un artículo escrito por ChatGPT → pertenece a AIGC

  • Una imagen generada por Gemini → pertenece a AIGC

  • Una pieza de música generada por Suno → pertenece a AIG

  • Un video generado por HeyGen → pertenece a AIGC


⏩ A continuación, ¿qué es la IA Generativa (IA generativa) que a menudo se menciona junto con AIGC?

La IA generativa se parece más a un nombre técnico, AIGC es el "producto" que produce

Si comparamos la IA generativa con un "horno" como máquina, entonces el "pastel" que sale de él es el producto AIGC

  • IA generativa (ChatGPT) → genera un artículo (AIGC)

  • IA generativa (Copilot) → genera un fragmento de código (AIGC)

  • IA generativa (DALL·E / Gemini) → genera una imagen (AIGC)

▪️ Por cierto: "Como la palabra AIGC es más popular en el país, se usa en muchas situaciones para referirse a la IA generativa, así que cuando alguien dice AIGC, no se puede afirmar que en realidad quiere hablar sobre la IA generativa~"


⏩ Después de dominar los tres conceptos básicos, hagamos un resumen:

¿Cuál es la relación entre la IA generativa, el aprendizaje automático, el aprendizaje supervisado, el aprendizaje no supervisado, el aprendizaje por refuerzo, el aprendizaje profundo y los grandes modelos de lenguaje, y qué son cada uno de ellos?


⏩ Aprendizaje automático — la rama más central y práctica de la IA

La clave está en que no se necesita que los humanos hagan programación explícita, sino que la computadora aprenda y mejore por sí misma a través de algoritmos, reconociendo patrones, haciendo predicciones y tomando decisiones.

▪️ Programación tradicional = los programadores escriben todas las reglas una por una en el código.

▪️ Aprendizaje automático = no escribir reglas fijas, dejar que la computadora reconozca patrones, haga predicciones y tome decisiones a partir de grandes cantidades de datos

🌰 Por ejemplo: enseñar a la computadora a distinguir entre "tierra" y "océano"

  • Programación tradicional: los programadores dicen a la computadora a través del código que si hay marrón en la imagen significa tierra, y si hay azul significa océano. De esta manera, el logro no es aprendizaje automático sino programación lógica directa por parte de humanos.

  • Aprendizaje automático: darle a la computadora una gran cantidad de imágenes de tierra y océano, para que la computadora reconozca y resuma por sí misma, pudiendo juzgar imágenes que nunca ha visto antes; esto es aprendizaje automático.

Luego hay muchas ramas bajo el aprendizaje automático

⏩ El primero es el aprendizaje supervisado: en los algoritmos de aprendizaje automático se utilizan datos de entrenamiento con anotaciones, las anotaciones son los valores de salida que esperamos

Es decir, los datos que proporcionamos para entrenar al robot deben tener tanto "características de entrada" como "valores de salida esperados". Lo que la máquina necesita aprender es encontrar la relación entre la entrada y la salida, y luego, al proporcionar nuevas "características de entrada", devolvernos el "valor de salida" exacto.

🌰 Por ejemplo: alimentamos a la máquina con un montón de imágenes etiquetadas de hombres y mujeres para entrenarla, luego le damos una foto sin etiqueta y le pedimos que infiera si la foto es de un hombre o una mujer; esto es aprendizaje supervisado.

⏩ Después del aprendizaje supervisado viene el aprendizaje no supervisado: a diferencia del aprendizaje supervisado, en este caso, los datos de entrenamiento que proporcionamos no tienen anotaciones, por lo que la máquina necesita descubrir de forma independiente los patrones y características de los datos.

🌰 Por ejemplo: le damos a la máquina una gran cantidad de imágenes de gatos, para que la máquina agrupe automáticamente las imágenes de gatos similares según características como la longitud del pelaje, el color del pelaje, el color de las pupilas, etc. Esto es aprendizaje no supervisado

⏩ A continuación, el aprendizaje por refuerzo: permite que la máquina tome diversas acciones en el entorno que hemos establecido y obtenga resultados para recibir retroalimentación, aprendiendo de la retroalimentación para que la máquina pueda tomar la mejor acción en situaciones específicas para maximizar la recompensa o minimizar la pérdida

🌰 Por ejemplo: entrenas a un perro pequeño en casa para que se siente. Al principio, el perro puede hacer varios movimientos, los movimientos incorrectos no recibirán nuestra recompensa, e incluso pueden ser castigados; solo cuando el perro complete correctamente el movimiento de sentarse, le damos una golosina. Así, el perro entenderá lentamente la relación entre sus acciones y las recompensas y castigos, y poco a poco comenzará a entender nuestras instrucciones, haciendo que su comportamiento se ajuste cada vez más a nuestras expectativas. Esto es aprendizaje por refuerzo.

⏩ Además de los tres métodos de aprendizaje mencionados, hay un aprendizaje profundo independiente: permite que los robots utilicen redes neuronales artificiales para simular la forma en que el cerebro humano procesa la información, extrayendo características de datos a través de un enfoque jerárquico para completar los pasos de aprendizaje. Además, como nuestras redes neuronales están compuestas por muchos neuronas computacionales y de almacenamiento, estas neuronas procesan datos a través de capas conectadas, y dado que los modelos de aprendizaje profundo suelen tener muchas capas, se les llama "aprendizaje profundo".

🌰 Por ejemplo: si se quiere que la computadora reconozca imágenes de perros, en el aprendizaje profundo, los datos recibidos por la máquina se transmiten primero a una capa de entrada, que es como los ojos humanos viendo imágenes, luego los datos pasan a través de múltiples capas ocultas, cada una de las cuales realiza ciertos cálculos complejos para ayudar a la computadora a entender las características de la imagen, como las orejas, ojos, nariz, etc., al final, la computadora producirá una respuesta que indique si es una imagen de un perro.

Las redes neuronales se pueden utilizar para aprendizaje supervisado, no supervisado y por refuerzo, por lo que no son un subconjunto de las tres formas de aprendizaje mencionadas anteriormente. La IA generativa que usamos comúnmente también es una aplicación del aprendizaje profundo, utilizando redes neuronales para reconocer y aprender contenido existente, generando así nuevo contenido. Hasta ahora, la forma en que la IA generativa puede generar contenido se ha enriquecido mucho~ como imágenes, código, audio, etc.

⏩ Por último, los grandes modelos de lenguaje (LLM) que usamos con más frecuencia: también son una aplicación del aprendizaje profundo, especializados en procesar tareas en lenguaje natural y con parámetros enormes (de cientos de miles de millones a billones), entrenados con enormes cantidades de texto, por lo que son especialmente buenos en "charlar, escribir, programar".

Por ejemplo, los que usamos: ChatGPT, Claude, Gemini, LLaMA, todos pertenecen a grandes modelos de lenguaje~

Los conceptos anteriores son los elementos clave de la IA generativa; su relación puede verse en la imagen a continuación.

Puede resumir visualmente la relación entre estos elementos~

Así concluye la guía de introducción a la IA para principiantes~

Espero que en el futuro podamos hablar con fluidez sobre estos términos técnicos de IA 🎤