Fact — reference — Knowledge Tree

In the paper 'Evaluating Evaluation Metrics — The Mirage of Hallucination Detection', the authors conducted a large-scale empirical evaluation of 6 diverse sets of hallucination detection metrics across 4 datasets, 37 language models from 5 families, and 5 decoding methods.

Authors

Person: Atharva Kulkarni, Yuan Zhang, Joel Ruben Antony Moniz, Xiou Ge, Bo-Hsiang Tseng, Dhivya Piraviperumal, Swabha Swayamdipta, Hong Yu Organization: Apple Machine Learning Research
Evaluating Evaluation Metrics — The Mirage of Hallucination ...
Person: Not available Organization: arXiv
Evaluating Evaluation Metrics -- The Mirage of Hallucination Detection

Sources

Evaluating Evaluation Metrics — The Mirage of Hallucination ... machinelearning.apple.com Atharva Kulkarni, Yuan Zhang, Joel Ruben Antony Moniz, Xiou Ge, Bo-Hsiang Tseng, Dhivya Piraviperumal, Swabha Swayamdipta, Hong Yu · Apple Machine Learning Research via serper
Evaluating Evaluation Metrics -- The Mirage of Hallucination Detection arxiv.org arXiv via serper

Referenced by nodes (2)

hallucination detection concept
Language Model concept