Jack Kong, CEO di Nano Labs, ha pubblicato su X. Viene suggerita una nuova strategia combinata per migliorare l'efficienza del recupero degli agenti locali. Utilizzando un approccio strutturato alle attività con un'architettura ad albero di anteprima mq e impiegando qmd per la scansione dei nomi dei file prima dell'estrazione precisa, il consumo di token può essere ridotto di oltre l'80% senza compromettere l'accuratezza. Con l'aumento dei costi dell'IA cloud, ottimizzare i processi locali sta diventando sempre più importante.
