Guia de Introdução à IA para Iniciantes: De Novato a Expert

Atualmente, muitos irmãos devem estar ansiosos sobre como acompanhar a era da IA.
Quero começar a aprender IA, mas várias coisas complexas são completamente confusas.
Esta edição começará pelo mais básico: o que é IA e o que é AIGC.
Com texto e ilustrações, vamos passo a passo ajudar os irmãos a entenderem os fundamentos da IA.
Apoiar os irmãos a embarcarem em seu próprio caminho na IA~

⏩ Vamos começar pela maior estrutura de todas: o que é IA?IA é inteligência artificial, que surgiu em 1956 como uma grande disciplina dentro da ciência da computação.
O objetivo é fazer com que sistemas de computador simulem a inteligência humana para resolver problemas e completar tarefas.
⏩ E então, o que é o AIGC, que tem sido mencionado frequentemente recentemente?AIGC = conteúdo gerado por IA
De forma simples: tudo que é conteúdo gerado pela IA é chamado de AIGC
Um artigo escrito pelo ChatGPT → pertence ao AIGC
Uma imagem gerada pelo Gemini → pertence ao AIGC
Uma música gerada pelo Suno → pertence ao AIG
Um vídeo gerado pelo HeyGen → pertence ao AIGC

⏩ A seguir, o que é a IA Generativa (Generative AI) que frequentemente é mencionada junto com AIGC?A IA generativa é mais um nome técnico, enquanto AIGC é o "produto" que ela gera
Se a IA generativa é como um "forno", então o "bolo" que sai dele é o produto AIGC
IA generativa (ChatGPT) → gera um artigo (AIGC)
IA generativa (Copilot) → gera um trecho de código (AIGC)
IA generativa (DALL·E / Gemini) → gera uma imagem (AIGC)
▪️ Ah, e só para lembrar: "Como o termo AIGC é mais popular no país, ele é usado em muitos contextos para se referir à IA generativa. Então, quando alguém menciona AIGC, pode ser que na verdade esteja se referindo à IA generativa, tá?~"

⏩ Após dominar os três conceitos básicos, vamos esclarecer:Qual é a relação entre IA generativa, aprendizado de máquina, aprendizado supervisionado, aprendizado não supervisionado, aprendizado por reforço, aprendizado profundo e grandes modelos de linguagem, e o que cada um deles representa?

⏩ Aprendizado de máquina — o ramo mais central e prático da IAO cerne está em não precisar que humanos programem explicitamente, mas sim deixar que o computador aprenda e melhore por conta própria, reconhecendo padrões, fazendo previsões e tomando decisões.
▪️ Programação tradicional = programadores escrevem regras uma a uma de forma rígida.
▪️ Aprendizado de máquina = não escrever regras rigidamente, mas deixar o computador identificar padrões, fazer previsões e tomar decisões a partir de grandes volumes de dados.
🌰 Para ilustrar: ensinar o computador a diferenciar "terra" e "oceano"
Programação tradicional: programadores dizem ao computador que se na imagem houver marrom, é terra, e se houver azul, é oceano. Esse tipo de lógica direta feita por humanos não é aprendizado de máquina.
Aprendizado de máquina: fornecemos ao computador uma grande quantidade de imagens de terra e oceano, e ele mesmo aprende a reconhecer e resumir, podendo julgar imagens que nunca viu antes. Isso é aprendizado de máquina.
Depois, dentro do aprendizado de máquina, existem muitos ramos
⏩ O primeiro é aprendizado supervisionado: algoritmos de aprendizado de máquina que usam dados de treinamento rotulados, onde as anotações são os valores de saída que esperamos.
Isso significa que os dados que fornecemos para treinar o robô devem ter tanto as "características de entrada" quanto os "valores de saída esperados", e a máquina precisa aprender a encontrar a relação entre entrada e saída, para que, ao fornecer novas "características de entrada", ela nos dê de volta valores de saída precisos.
🌰 Para ilustrar: pegamos um monte de fotos rotuladas de homens e mulheres e alimentamos a máquina para treiná-la. Depois, damos a ela uma foto sem rótulo e pedimos que ela identifique se é um homem ou uma mulher. Isso é aprendizado supervisionado.
⏩ Depois do aprendizado supervisionado vem o aprendizado não supervisionado: ao contrário do supervisionado, os dados de treinamento que fornecemos não estão rotulados, então a máquina precisa descobrir os padrões e características dos dados por conta própria.
🌰 Para ilustrar: fornecemos uma grande quantidade de imagens de gatos, e a máquina, com base em características como comprimento e cor do pelo, e cor da pupila, agrupa automaticamente imagens semelhantes de gatinhos. Isso é aprendizado não supervisionado.
⏩ A seguir, é o aprendizado por reforço: permite que a máquina tome várias ações em um ambiente definido por nós e obtenha resultados para aprender com o feedback, ajudando a máquina a adotar o melhor comportamento em situações específicas para maximizar recompensas ou minimizar perdas.
🌰 Para ilustrar: você treina um cachorro em casa para sentar. No início, o cachorro pode fazer vários movimentos diferentes, e movimentos errados não recebem recompensas, podendo até ser punidos. Porém, quando o cachorro realiza o movimento correto, damos um petisco. Assim, o cachorro começa a entender a relação entre seus movimentos e as recompensas, e gradualmente passa a entender nossos comandos, ajustando seu comportamento às nossas expectativas. Isso é aprendizado por reforço.
⏩ Além das três formas de aprendizado mencionadas, há um aprendizado profundo independente: permite que robôs usem redes neurais artificiais para simular a forma como o cérebro humano processa informações, extraindo características de dados de maneira hierárquica, e como nossas redes neurais são compostas por muitos neurônios de computação e armazenamento, esses neurônios se conectam em camadas para processar dados. Como os modelos de aprendizado profundo geralmente têm muitas camadas, são chamados de "aprendizado profundo".
🌰 Para ilustrar: se quisermos que o computador reconheça imagens de cachorros, no aprendizado profundo, os dados recebidos são primeiro passados por uma camada de entrada, que funciona como os olhos humanos vendo a imagem. Depois, os dados percorrem várias camadas ocultas, onde cada camada realiza cálculos complexos para ajudar o computador a entender as características da imagem, como as orelhas, os olhos e o nariz do cachorro. No final, o computador gera uma resposta, indicando se a imagem é de um cachorro.
As redes neurais podem ser usadas para aprendizado supervisionado, não supervisionado e por reforço, portanto, não pertencem a nenhum dos três tipos de aprendizado mencionados. A IA generativa que costumamos usar também é uma aplicação de aprendizado profundo, utilizando redes neurais para reconhecer e aprender conteúdos existentes, gerando novos conteúdos. Hoje em dia, a IA generativa já pode criar conteúdos em várias formas, como imagens, códigos, áudio, entre outros.
⏩ Por fim, temos os grandes modelos de linguagem (LLM), que também são uma aplicação de aprendizado profundo, especializados em lidar com tarefas em linguagem natural e cujos parâmetros são enormes (de centenas de bilhões a trilhões), treinados com um grande volume de textos, por isso são especialmente bons em "conversar, escrever e programar".
Por exemplo, os que usamos: ChatGPT, Claude, Gemini, LLaMA, todos pertencem a grandes modelos de linguagem~
Esses conceitos acima são os elementos centrais da IA gerativa, e suas relações podem ser vistas na imagem abaixo.
Ela consegue resumir intuitivamente as relações entre esses elementos~
E assim termina o guia de introdução à IA para iniciantes~
Espero que no futuro possamos discutir esses termos de tecnologia de IA com facilidade 🎤