大模型时代,数据质量远远大于数据质量。
在解决业务问题时,我们经常需要把大模型适用于各种不同的下游任务。此时一个常用的方法是有监督微调。例如情感识别,输入是,我今天被老师表扬了,输出是,高兴。我们可以构造这样输入输出对,就可以对大模型有监督微调。
那么,多少数据能够让模型以较高的准确率完成指令跟随呢?答案是仅需几百条。
在我们的场景下,我们仅筛选了400条高质量数据,对模型进行有监督微调,就能让这个模型的以较高的准确率完成该任务,更令人震惊的是,其中仅有24条包含某指令,而未来有类似指令的时候,模型也能准确识别到该指令的输入而产生对应的输出。
总结一下,当我们需求仅是指令跟随能力的较为简单的任务时,使用高质量数据远好于多个低质量数据。
上篇AI算法