Tag: Ranking System
All the papers with the tag "Ranking System".
am-ELO: A Stable Framework for Arena-based LLM Evaluation
grok-3-latestScore: 0.47Published: at 12:28本文提出 am-ELO 框架,通过最大似然估计和标注者能力建模,显著提升了大型语言模型竞技场评估中 ELO 评分系统的稳定性和准确性。
All the papers with the tag "Ranking System".
本文提出 am-ELO 框架,通过最大似然估计和标注者能力建模,显著提升了大型语言模型竞技场评估中 ELO 评分系统的稳定性和准确性。