Guida introduttiva all'AI per principianti, da neofita a esperto

Attualmente, molti fratelli sono ansiosi di sapere come tenere il passo con l'era dell'AI
Voglio iniziare a studiare l'AI, ma tutte queste cose complesse sono completamente incomprensibili
In questa edizione, partiremo dalle basi: cos'è l'AI e cos'è l'AIGC
Con parole e illustrazioni, guiderò i fratelli a comprendere passo dopo passo i fondamenti dell'AI
Aiutiamo i fratelli a intraprendere il proprio cammino nell'AI~

⏩ Iniziamo dal quadro più ampio dell'AI: cos'è l'AI?L'AI è l'intelligenza artificiale, nata nel 1956 come una grande disciplina nel dipartimento di scienze informatiche
L'obiettivo è far sì che i sistemi informatici simulino l'intelligenza umana per risolvere problemi e completare compiti
⏩ Poi c'è la domanda più frequentemente menzionata: cos'è AIGC?AIGC = contenuti generati dall'AI
In poche parole: tutto ciò che è contenuto generato dall'AI è chiamato AIGC
Un articolo scritto da ChatGPT → appartiene a AIGC
Un'immagine generata da Gemini → appartiene a AIGC
Un brano musicale generato da Suno → appartiene a AIG
Un video generato da HeyGen → appartiene a AIGC

⏩ La Generative AI (AI generativa), spesso menzionata insieme a AIGC, cosa è?L'AI generativa è più un nome tecnico; AIGC è il 'prodotto' che produce
Se confrontiamo l'AI generativa a un 'forno', allora la 'torta' che esce è il prodotto AIGC
AI generativa (ChatGPT) → produce un articolo (AIGC)
AI generativa (Copilot) → produce un codice (AIGC)
AI generativa (DALL·E / Gemini) → produce un'immagine (AIGC)
▪️ A proposito: 'Poiché il termine AIGC è più popolare in patria, viene utilizzato in molte situazioni per riferirsi all'AI generativa, quindi quando qualcuno dice AIGC, non è certo che voglia dire AI generativa~'

⏩ Dopo aver padroneggiato i tre concetti fondamentali, facciamo un riepilogo:Qual è la relazione tra AI generativa, apprendimento automatico, apprendimento supervisionato, apprendimento non supervisionato, apprendimento per rinforzo, apprendimento profondo e grandi modelli linguistici? Cosa sono esattamente?

⏩ L'apprendimento automatico è il ramo più centrale e pratico dell'AIIl punto centrale è che non è necessario programmare esplicitamente, ma permettere al computer di imparare e migliorare autonomamente attraverso algoritmi, riconoscendo modelli, facendo previsioni e decisioni.
▪️ Programmazione tradizionale = i programmatori scrivono tutte le regole punto per punto nel codice.
▪️ L'apprendimento automatico = non scrivere regole fisse, ma far sì che il computer riconosca modelli, faccia previsioni e decisioni da un grande volume di dati
🌰 Facciamo un esempio: insegnare al computer a distinguere tra 'terra' e 'oceano'
Programmazione tradizionale: i programmatori dicono al computer tramite codice che un'immagine marrone indica 'terra' e un'immagine blu indica 'oceano'. Questo tipo di logica scritta direttamente dall'uomo non è apprendimento automatico.
Apprendimento automatico: diamo al computer enormi quantità di immagini di terra e oceano, affinché il computer possa identificare autonomamente, riassumere e poi giudicare anche su immagini mai viste prima. Questo è l'apprendimento automatico.
Poi, sotto l'apprendimento automatico, ci sono molti rami
⏩ Il primo è l'apprendimento supervisionato: gli algoritmi di apprendimento automatico utilizzano dati di addestramento con annotazioni, dove le annotazioni sono i valori di output attesi
In altre parole, i dati di addestramento forniti ai robot devono contenere sia 'caratteristiche di input' che 'valori di output attesi', e ciò che la macchina deve imparare è trovare la relazione tra input e output, per poi fornirci valori di output accurati quando diamo nuove 'caratteristiche di input'.
🌰 Facciamo un esempio: forniamo al computer un insieme di immagini annotate di uomini e donne e poi diamo al computer una foto non annotata, chiedendo di dedurre se la foto rappresenta un uomo o una donna. Questo è l'apprendimento supervisionato.
⏩ Dopo l'apprendimento supervisionato c'è l'apprendimento non supervisionato: a differenza dell'apprendimento supervisionato, i dati di addestramento forniti per questo algoritmo di apprendimento automatico non sono annotati, quindi la macchina deve scoprire autonomamente i modelli e le regole dei dati.
🌰 Facciamo un esempio: diamo al computer molte immagini di gatti, affinché il computer possa automaticamente raggruppare le immagini di gattini simili in base a caratteristiche come lunghezza e colore del pelo, colore della pupilla, ecc. Questo è l'apprendimento non supervisionato
⏩ Proseguiamo con l'apprendimento per rinforzo: consente alla macchina di intraprendere varie azioni nell'ambiente che abbiamo impostato e ottenere risultati per ricevere feedback, imparando da questo feedback, in modo che la macchina possa adottare il comportamento ottimale in situazioni specifiche per massimizzare le ricompense o minimizzare le perdite
🌰 Facciamo un esempio: addestri un cucciolo a sedersi a casa. All'inizio, il cucciolo potrebbe compiere vari movimenti, quelli errati non riceveranno la nostra ricompensa e potrebbero addirittura essere puniti. Solo quando il cucciolo esegue correttamente il movimento di sedersi, gli diamo un piccolo premio. In questo modo, il cucciolo comincia a capire la relazione tra le sue azioni e le ricompense, e gradualmente imparerà a seguire i nostri comandi, comportandosi sempre più come ci aspettiamo. Questo è l'apprendimento per rinforzo.
⏩ Oltre ai tre tipi di apprendimento sopra, c'è un apprendimento profondo indipendente: consente ai robot di utilizzare reti neurali artificiali, simulando il modo in cui il cervello umano elabora le informazioni, estraendo le caratteristiche dei dati in modo gerarchico per completare i passaggi di apprendimento. Inoltre, poiché la nostra rete neurale è composta da molti neuroni che calcolano e memorizzano, questi neuroni elaborano i dati tramite connessioni strato per strato. Poiché i modelli di apprendimento profondo di solito hanno molti strati, vengono definiti 'apprendimento profondo'
🌰 Facciamo un esempio: per far riconoscere al computer le immagini dei cuccioli, nel deep learning, i dati ricevuti dalla macchina sono prima trasmessi a uno strato di input, che è come gli occhi umani che guardano l'immagine. Poi i dati passano attraverso più strati nascosti, ognuno dei quali esegue calcoli complessi per aiutare il computer a comprendere le caratteristiche dell'immagine, come le orecchie, gli occhi, il naso del cucciolo, ecc. Alla fine, il computer restituirà una risposta, indicando se si tratta di un'immagine di un cucciolo.
Le reti neurali possono essere utilizzate per apprendimento supervisionato, non supervisionato e per rinforzo, quindi non sono un sottoinsieme di nessuno dei tre tipi di apprendimento sopra menzionati. L'AI generativa che utilizziamo è anche un'applicazione dell'apprendimento profondo, che utilizza reti neurali per riconoscere e apprendere contenuti esistenti, generando così nuovi contenuti. Oggi, le forme di contenuti che l'AI generativa può produrre sono già molto ricche~ come immagini, codici, audio, ecc.
⏩ Infine, abbiamo i grandi modelli linguistici (LLM) che utilizziamo più frequentemente: è anche un'applicazione dell'apprendimento profondo, specializzata nell'affrontare compiti con il linguaggio naturale, e i parametri del modello sono enormi (da decine di miliardi a trilioni) e addestrati su enormi quantità di testo, quindi è particolarmente bravo a 'conversare, scrivere, programmare'.
Ad esempio, quelli che usiamo: ChatGPT, Claude, Gemini, LLaMA, tutti appartengono a grandi modelli linguistici~
I concetti sopra sono gli elementi chiave dell'AI generativa, e le loro relazioni possono essere viste nella figura sottostante.
Può riassumere visivamente le relazioni tra questi elementi~
Fino a qui la guida introduttiva all'AI per principianti è completata~
Spero che in futuro possiamo parlare fluentemente di queste tecnologie AI🎤