Atualmente, muitos irmãos devem estar ansiosos sobre como acompanhar a era da IA.

Quero começar a aprender IA, mas várias coisas complexas são completamente confusas.

Esta edição começará pelo mais básico: o que é IA e o que é AIGC.

Com texto e ilustrações, vamos passo a passo ajudar os irmãos a entenderem os fundamentos da IA.

Apoiar os irmãos a embarcarem em seu próprio caminho na IA~


⏩ Vamos começar pela maior estrutura de todas: o que é IA?

IA é inteligência artificial, que surgiu em 1956 como uma grande disciplina dentro da ciência da computação.

O objetivo é fazer com que sistemas de computador simulem a inteligência humana para resolver problemas e completar tarefas.

⏩ E então, o que é o AIGC, que tem sido mencionado frequentemente recentemente?

AIGC = conteúdo gerado por IA

De forma simples: tudo que é conteúdo gerado pela IA é chamado de AIGC

  • Um artigo escrito pelo ChatGPT → pertence ao AIGC

  • Uma imagem gerada pelo Gemini → pertence ao AIGC

  • Uma música gerada pelo Suno → pertence ao AIG

  • Um vídeo gerado pelo HeyGen → pertence ao AIGC


⏩ A seguir, o que é a IA Generativa (Generative AI) que frequentemente é mencionada junto com AIGC?

A IA generativa é mais um nome técnico, enquanto AIGC é o "produto" que ela gera

Se a IA generativa é como um "forno", então o "bolo" que sai dele é o produto AIGC

  • IA generativa (ChatGPT) → gera um artigo (AIGC)

  • IA generativa (Copilot) → gera um trecho de código (AIGC)

  • IA generativa (DALL·E / Gemini) → gera uma imagem (AIGC)

▪️ Ah, e só para lembrar: "Como o termo AIGC é mais popular no país, ele é usado em muitos contextos para se referir à IA generativa. Então, quando alguém menciona AIGC, pode ser que na verdade esteja se referindo à IA generativa, tá?~"


⏩ Após dominar os três conceitos básicos, vamos esclarecer:

Qual é a relação entre IA generativa, aprendizado de máquina, aprendizado supervisionado, aprendizado não supervisionado, aprendizado por reforço, aprendizado profundo e grandes modelos de linguagem, e o que cada um deles representa?


⏩ Aprendizado de máquina — o ramo mais central e prático da IA

O cerne está em não precisar que humanos programem explicitamente, mas sim deixar que o computador aprenda e melhore por conta própria, reconhecendo padrões, fazendo previsões e tomando decisões.

▪️ Programação tradicional = programadores escrevem regras uma a uma de forma rígida.

▪️ Aprendizado de máquina = não escrever regras rigidamente, mas deixar o computador identificar padrões, fazer previsões e tomar decisões a partir de grandes volumes de dados.

🌰 Para ilustrar: ensinar o computador a diferenciar "terra" e "oceano"

  • Programação tradicional: programadores dizem ao computador que se na imagem houver marrom, é terra, e se houver azul, é oceano. Esse tipo de lógica direta feita por humanos não é aprendizado de máquina.

  • Aprendizado de máquina: fornecemos ao computador uma grande quantidade de imagens de terra e oceano, e ele mesmo aprende a reconhecer e resumir, podendo julgar imagens que nunca viu antes. Isso é aprendizado de máquina.

Depois, dentro do aprendizado de máquina, existem muitos ramos

⏩ O primeiro é aprendizado supervisionado: algoritmos de aprendizado de máquina que usam dados de treinamento rotulados, onde as anotações são os valores de saída que esperamos.

Isso significa que os dados que fornecemos para treinar o robô devem ter tanto as "características de entrada" quanto os "valores de saída esperados", e a máquina precisa aprender a encontrar a relação entre entrada e saída, para que, ao fornecer novas "características de entrada", ela nos dê de volta valores de saída precisos.

🌰 Para ilustrar: pegamos um monte de fotos rotuladas de homens e mulheres e alimentamos a máquina para treiná-la. Depois, damos a ela uma foto sem rótulo e pedimos que ela identifique se é um homem ou uma mulher. Isso é aprendizado supervisionado.

⏩ Depois do aprendizado supervisionado vem o aprendizado não supervisionado: ao contrário do supervisionado, os dados de treinamento que fornecemos não estão rotulados, então a máquina precisa descobrir os padrões e características dos dados por conta própria.

🌰 Para ilustrar: fornecemos uma grande quantidade de imagens de gatos, e a máquina, com base em características como comprimento e cor do pelo, e cor da pupila, agrupa automaticamente imagens semelhantes de gatinhos. Isso é aprendizado não supervisionado.

⏩ A seguir, é o aprendizado por reforço: permite que a máquina tome várias ações em um ambiente definido por nós e obtenha resultados para aprender com o feedback, ajudando a máquina a adotar o melhor comportamento em situações específicas para maximizar recompensas ou minimizar perdas.

🌰 Para ilustrar: você treina um cachorro em casa para sentar. No início, o cachorro pode fazer vários movimentos diferentes, e movimentos errados não recebem recompensas, podendo até ser punidos. Porém, quando o cachorro realiza o movimento correto, damos um petisco. Assim, o cachorro começa a entender a relação entre seus movimentos e as recompensas, e gradualmente passa a entender nossos comandos, ajustando seu comportamento às nossas expectativas. Isso é aprendizado por reforço.

⏩ Além das três formas de aprendizado mencionadas, há um aprendizado profundo independente: permite que robôs usem redes neurais artificiais para simular a forma como o cérebro humano processa informações, extraindo características de dados de maneira hierárquica, e como nossas redes neurais são compostas por muitos neurônios de computação e armazenamento, esses neurônios se conectam em camadas para processar dados. Como os modelos de aprendizado profundo geralmente têm muitas camadas, são chamados de "aprendizado profundo".

🌰 Para ilustrar: se quisermos que o computador reconheça imagens de cachorros, no aprendizado profundo, os dados recebidos são primeiro passados por uma camada de entrada, que funciona como os olhos humanos vendo a imagem. Depois, os dados percorrem várias camadas ocultas, onde cada camada realiza cálculos complexos para ajudar o computador a entender as características da imagem, como as orelhas, os olhos e o nariz do cachorro. No final, o computador gera uma resposta, indicando se a imagem é de um cachorro.

As redes neurais podem ser usadas para aprendizado supervisionado, não supervisionado e por reforço, portanto, não pertencem a nenhum dos três tipos de aprendizado mencionados. A IA generativa que costumamos usar também é uma aplicação de aprendizado profundo, utilizando redes neurais para reconhecer e aprender conteúdos existentes, gerando novos conteúdos. Hoje em dia, a IA generativa já pode criar conteúdos em várias formas, como imagens, códigos, áudio, entre outros.

⏩ Por fim, temos os grandes modelos de linguagem (LLM), que também são uma aplicação de aprendizado profundo, especializados em lidar com tarefas em linguagem natural e cujos parâmetros são enormes (de centenas de bilhões a trilhões), treinados com um grande volume de textos, por isso são especialmente bons em "conversar, escrever e programar".

Por exemplo, os que usamos: ChatGPT, Claude, Gemini, LLaMA, todos pertencem a grandes modelos de linguagem~

Esses conceitos acima são os elementos centrais da IA gerativa, e suas relações podem ser vistas na imagem abaixo.

Ela consegue resumir intuitivamente as relações entre esses elementos~

E assim termina o guia de introdução à IA para iniciantes~

Espero que no futuro possamos discutir esses termos de tecnologia de IA com facilidade 🎤