AI论文综述:语言模型是无监督多任务学习者(GPT-2)
freeCodeCamp.org3193 字 (约 13 分钟)
92
GPT-2证明仅通过无监督的下一词预测训练,大语言模型可自发涌现出多任务能力,无需任务特定微调即可实现翻译、问答和摘要等功能。
入选理由:GPT-2在800万网页文本上训练,参数量达15亿,首次展示零样本迁移能力。
精选文章#GPT-2#大语言模型#零样本学习#Transformer英文
概念
模型在未经显式训练的情况下执行新任务的能力。
已收录 1 条与 zero-shot learning 相关的内容,按评分排序。
GPT-2证明仅通过无监督的下一词预测训练,大语言模型可自发涌现出多任务能力,无需任务特定微调即可实现翻译、问答和摘要等功能。
入选理由:GPT-2在800万网页文本上训练,参数量达15亿,首次展示零样本迁移能力。