我不会写代码,但我上周微调了一个AI模型
我得先说清楚我的背景:我不是工程师,没学过机器学习,Python只会复制粘贴别人的代码然后报错。
所以当我说"我上周微调了一个AI模型",你可能会觉得我在标题党。
但我并没有。
事情是这样开始的。我在研究@OpenLedger 的生态工具,看到ModelFactory的介绍说"纯GUI操作,不需要命令行,不需要API集成"。我下意识的反应是——这种话我见过太多次了,点进去一定是骗人的。
我点进去了。
界面确实干净得有点出乎意料。左侧是数据集请求入口,中间是模型选择和参数配置,右侧是训练监控面板。没有让我填任何环境变量,没有叫我装任何依赖库。
我选了一个我自己整理过的小型数据集——大概两百条关于传统中医食疗的问答对,是我之前帮一个中医馆做内容整理时攒下来的,一直躺在硬盘里没用武之地。我把它上传到Datanet,等待审核通过,大概花了不到一天。
然后我在ModelFactory里选了基础模型,配置LoRA参数(界面上有说明,我大概看懂了七成),提交训练任务。
等待过程有点无聊。我以为会很快,结果盯着进度条看了将近四十分钟。
然后它跑完了。
我打开内置的对话测试界面,问了一个问题:"冬天手脚冰凉适合吃什么?"
它给出了一个答案,有条理,有引用逻辑,跟通用大模型给出的泛泛而谈不一样——明显带着我那批数据的语气和侧重点。
我盯着屏幕看了大概三十秒。
说实话,有点奇怪的成就感。不是因为技术多复杂,恰恰相反,是因为这件事本来应该很难,但它不难。我两百条手动整理的数据,真的变成了一个有点能打的垂直问答模型。
白皮书里有一句话我之前没太注意:专业化AI的核心瓶颈不是模型规模,而是高质量的垂直数据。现在理解了。我那两百条中医问答,换成通用爬虫数据,出来的效果一定没这个准。
当然,问题也有。
RAG归因模块我没完全搞懂,它显示了数据来源,但格式对普通用户来说仍然偏技术。Benchmarking那块的BLEU和Rouge分数,我需要去查才知道好不好——这个对非技术背景的人不够友好,应该直接翻译成"比通用模型好XX%"这种表述。
还有一个现实问题:Datanet的审核周期。如果上传的数据需要等超过一天才能开始训练,对想快速迭代的人来说会有点卡。
但那个成就感是真实的。
我有朋友在做K12教育内容,手里攒了几年的错题分析数据,一直不知道怎么用。我打算把ModelFactory推给他试试。
如果一个不会写代码的人能微调出一个能用的专科模型,这件事的边界就比大多数人想的要宽很多。