- 把prompting交给他人:Prompting是提升效果的重要手段,这个步骤是必要的,可以把这步交给产品或者后端,你只用效果最好的Prompt;
- 只做一次数据清洗:数据对大模型效果有至关重要的作用,这步必须自己做,但这个过程可以结合自己对业务的理解做一次非常全的数据清洗,然后训练一版模型,跑一版benchmark,如果各个指标都有提升,剩下的交给产品或者后端做基于新训练的模型做prompting,自己再同步做别的事情;
- 理解模型元能力提升的关键:大模型的指令跟随能力,推理能力,上下文学习能力,都是模型的元能力,这些能力是由一些特殊的训练方法和数据习得的,掌握了提升模型元能力的方法,就能对整体效果的把控性更强,也能进阶成更好的大模型算法。可以在第二步中多多探索不同数据对于模型各项能力benchmark的提升;
- 合并迭代:效果的优化往往需要较长时间,学会拒绝不能完成的效果提升或者合并几次提升到一次迭代里,否则会陷入到做业务需求的死循环中。
上篇AI算法