A Deep Dive into Calibration of Language Models: Platt Scaling, Isotonic Regression, Temperature Scaling
KDnuggets1546 字 (约 7 分钟)
87
LLMs常见的过度自信问题可通过温度缩放、Platt缩放和等距回归三种后置校准方法显著改善,尤其是温度缩放因其参数少、易实现而成为首选。
入选理由:2024 NAACL调查显示,LLM在事实问答、代码生成和推理任务中的置信度与实际准确率差距可达30%+。
精选文章#LLM#Calibration#Temperature Scaling#Platt Scaling#Isotonic Regression中文
