Jack Kong, CEO de Nano Labs, publicó en X. Se está sugiriendo una nueva estrategia de combinación para mejorar la eficiencia de la recuperación de agentes locales. Al utilizar un enfoque de tarea estructurada con una arquitectura de árbol de vista previa mq, y emplear qmd para escanear nombres de archivos antes de la extracción precisa, el consumo de tokens se puede reducir en más del 80% sin comprometer la precisión. A medida que los costos de la IA en la nube continúan aumentando, optimizar los procesos locales se vuelve cada vez más importante.
