No sé escribir código, pero la semana pasada ajusté un modelo de IA.
Debo aclarar mi contexto: no soy ingeniero, no he estudiado aprendizaje automático, solo sé copiar y pegar el código de otros y luego me da error.
Así que cuando digo "la semana pasada ajusté un modelo de IA", podrías pensar que estoy buscando atención.
Pero no lo estoy.
Las cosas empezaron así. Estaba investigando herramientas ecológicas de @OpenLedger y vi la presentación de ModelFactory que decía "operaciones puramente GUI, sin necesidad de línea de comandos, sin necesidad de integración API". Mi reacción instintiva fue—he visto este tipo de cosas demasiadas veces, si entro seguro que es un engaño.
Entré.
La interfaz es sorprendentemente limpia. A la izquierda está la entrada para solicitar el conjunto de datos, en el medio la selección del modelo y configuración de parámetros, y a la derecha el panel de monitoreo del entrenamiento. No me pidió llenar ninguna variable de entorno ni instalar ninguna biblioteca de dependencias.
Elegí un pequeño conjunto de datos que había organizado yo mismo — alrededor de doscientos pares de preguntas y respuestas sobre la terapia alimentaria tradicional china, que recopilé mientras ayudaba a una clínica de medicina china con la organización de contenido, y que había estado guardado en el disco duro sin uso. Lo subí a Datanet, esperando la aprobación, y tardó menos de un día.
Luego seleccioné el modelo base en ModelFactory, configuré los parámetros de LoRA (la interfaz tiene explicaciones, creo que entendí alrededor del setenta por ciento) y envié la tarea de entrenamiento.
El proceso de espera es un poco aburrido. Pensé que sería rápido, pero estuve mirando la barra de progreso durante casi cuarenta minutos.
Y luego terminó.
Abrí la interfaz de prueba de diálogo incorporada y hice una pregunta: '¿Qué es bueno comer en invierno si tienes las manos y pies fríos?'
Dio una respuesta que es ordenada, con lógica de citas, diferente de lo que da el modelo general, claramente reflejando el tono y enfoque de mis datos.
Estuve mirando la pantalla por unos treinta segundos.
Sinceramente, es una sensación de logro un poco extraña. No porque la tecnología sea muy compleja, sino al contrario, porque esto debería ser difícil, pero no lo es. Mis doscientos datos organizados manualmente realmente se convirtieron en un modelo de preguntas y respuestas vertical que puede dar pelea.
Hay una frase en el whitepaper que no había notado antes: el cuello de botella del AI especializado no es la escala del modelo, sino los datos verticales de alta calidad. Ahora lo entiendo. Mis doscientos pares de preguntas y respuestas de medicina china, si los cambiara por datos generales de scraping, el resultado no sería tan preciso.
Por supuesto, también hay problemas.
No entendí completamente el módulo de atribución RAG, muestra la fuente de los datos, pero el formato sigue siendo muy técnico para el usuario común. En la parte de benchmarking, las puntuaciones BLEU y Rouge, necesito investigar para saber si son buenas — esto no es amigable para quienes no tienen un trasfondo técnico, debería traducirse directamente a 'mejor que el modelo general en un XX%'.
Hay un tema real: el ciclo de revisión de Datanet. Si los datos que subes tardan más de un día en empezar a entrenar, se vuelve un poco lento para quienes quieren iterar rápido.
Pero esa sensación de logro es real.
Tengo un amigo que trabaja en contenido educativo K12, tiene años de datos de análisis de errores acumulados y no sabía cómo utilizarlos. Planeo recomendarle ModelFactory para que lo pruebe.
Si alguien que no sabe programar puede ajustar un modelo especializado que funcione, la frontera de esto es mucho más amplia de lo que la mayoría de la gente piensa.