
谷歌近日发布了一款名为ASPIRE的训练框架,旨在增强大语言模型的选择性预测能力。该框架引入了“可信度”机制,即模型会输出一系列答案,并附上正确概率评分。
ASPIRE训练框架主要分为三个阶段:特定任务调整、答案采样和自我评估学习。在特定任务调整阶段,大型语言模型接受深入训练,以提高其预测能力。研究人员引入了一系列可调参数,在特定任务的训练数据集上微调预训练语言模型,从而提升其解决问题的能力。
在答案采样阶段,经过微调后的模型可以生成不同答案,并创建用于自我评估学习的数据集。研究人员使用“集束搜索(Beam Search)”方法和Rouge-L算法来评估答案质量,并将生成的答案及评分重新输入给模型开始第三阶段——自我评估学习。在这个阶段中,研究人员为模型添加一组可调参数,专门用于提高其自我评估能力。
据称,“经过ASPIRE调整的小型OPT-2.7B 模型表现优于更大的 OPT-30B 模型”。这项实验结果表明,即使是最小的语言模型,在适当的微调后也可以在某些场景下超越最大的语言模型。
研究人员认为,ASPIRE框架训练能够显著提高大语言模型的输出准确率,并且小型模型经过微调后也可以进行“准确且有自信”的预测。这一成果对于人工智能领域的应用具有重要意义。
本文属于原创文章,如若转载,请注明来源:谷歌发布新框架,小型语言模型经过微调后可以超越大型语言模型https://news.zol.com.cn/853/8530079.html