【AI】No free launch：Guided Generation 严重降低推理能力

No free lunch: Guided Gen严重降低推理能力

类别：推理

一句话总结：Guided generation可以强制让模型生成固定格式的输出，但是会严重降低推理能力。一个不错的解决方法是，采用两步策略，先让模型生成随意的output，再交互一轮生成带格式的输出。

Existing Gap

Guided Generation能够强制模型生成固定格式，具体原理可以参考这篇文章：https://hypercool.cn/ai_concepts/ai_inference/ai/ai_algorithms/2024/08/19/guided-decoding.html。但是Guided Generation有什么问题吗？可以在下图看到JSON-mode在以下的benchmark上性能下降严重。

bbf7aad4f78f3dfa62be07fcaafafe85_1_Figure_2_1307511317

Proposed solution

目前的方法基本都是时间和空间换质量，简单来说，就是通过两步生成，第一步让模型按照生成要求自由发挥，再进行第二轮交互，让模型给原输出加一个固定的Format。第二步既可以用自然语言instruction的方式加format，也可以用guided Generation严格让模型输出固定格式。这两种方法都可以提升结果的质量，同时保证format。

这里还有trick，就是第二步生成可以不用原始模型，而是使用更小的模型，因为第二步的任务只是加format，相对简单，可以极大缩短生成时延。