Il progetto #Mira verifica le risposte date ad altri IA. È chiaro e molti altri IA risolvono se la risposta è corretta o meno.
Cioè, se la maggior parte dei revisori IA decide che la risposta è corretta, viene accettata, mentre se decidono che la risposta è errata, viene rifiutata.
Solo che questo è semplice quando l'IA si basa su dati storici e tutto ciò lo prende da internet, e se c'è un errore su internet, allora anche tutti i revisori IA accetteranno la risposta come vera; c'è anche la difficoltà di verificare il fatto necessario dal testo, anche in una sola frase ci possono essere 6-7 fatti da verificare, e se il testo è lungo 7000-10000 parole, ci sono molti fatti e la loro verifica può essere lunga e costosa.
E più avanti è ancora più difficile considerando: turismo, medicina, scienza.
Se nel caso del turismo non è ancora così difficile, l'IA può prendere fonti su internet come il meteo, le recensioni di altri viaggiatori, i flussi turistici, e così via.
In medicina è tutto più complicato
La verifica avviene attraverso database di pubblicazioni scientifiche e appunti, così come prove cliniche e ricerche mediche.
Spesso tutto questo non è disponibile pubblicamente, specialmente se i farmaci sono sperimentali o segreti.
Qui si pone la questione se il MEDICO debba prescrivere questo farmaco al paziente o meno. Anche se l'IA ha risposto che il farmaco aiuterà contro quella o quell'altra malattia.
E nella scienza è davvero difficile poiché l'IA può fornire solo ipotesi non verificate.
Poiché sono necessari esperimenti, dati di laboratorio, ripetibilità dei risultati.
Quindi, anche se un sistema come $MIRA funziona bene, dirà più spesso:
Probabilmente è vero, o ci sono dati insufficienti, o è dubbio.
E non semplicemente ~"verità"/"falsità".
Ma è proprio a causa di questo problema che il mercato di progetti come Mira può diventare enorme.
A proposito, l'approccio del progetto Mira è di controllare le risposte dell'IA attraverso molte altre IA.
e suddividere la risposta in diverse affermazioni prima della verifica riduce gli errori dell'IA.
Al 90% e attualmente questo è il miglior risultato. Rispetto ad altri progetti che utilizzano l'IA.
