提升代理工具调用准确性:使用SFT和DPO在Amazon SageMaker AI上
AWS Machine Learning Blog3934 字 (约 16 分钟)
85
通过使用监督微调(SFT)和直接偏好优化(DPO)技术,可以显著提高小语言模型在Amazon SageMaker AI上的工具调用准确性。这些方法结合了高质量数据集和人类反馈,以优化模型与数字工具的交互能力。
入选理由:使用SFT和DPO技术可以提高AI代理执行复杂任务时选择正确工具的能力。
精选文章#监督微调#直接偏好优化#Amazon SageMaker AI英文
