【AI】Qwen Top Papers

 

做RL还是得学好Math

前一段时间看到的一篇Post深感其然,就是现在的RL Post-train还是非常鼓励大家多通过Math的方法