Fact — measurement — Knowledge Tree

The study evaluated hallucination rates and clinical risk severity for five Large Language Models: o1, gemini-2.0-flash-exp, gpt-4o, gemini-1.5-flash, and claude-3.5 sonnet.

Authors

Person: Not available Organization: medRxiv
Medical Hallucination in Foundation Models and Their ...

Sources

Medical Hallucination in Foundation Models and Their ... www.medrxiv.org medRxiv via serper
Medical Hallucination in Foundation Models and Their Impact on ... www.medrxiv.org medRxiv via serper

Referenced by nodes (5)