11月,NVIDIA发布了HelpSteer,一个对齐微调数据集,根据几个标准提供提示、相关模型响应和所述答案的等级,而Microsoft Research发布了Orca-2模型,是一个在新的合成推理数据集上微调的
典型的合成数据集包括 AlpacaDataCleaned、WizardLM、Orca-2–13b 和 Baize 等,它们为模型训练提供了丰富且多样化的样本支持。
achieved the best tradeoff with 35.5% hallucination rate and low error rate, while models like LLAMA-2 and Orca