Fact — procedure — Knowledge Tree

Decision Points RL (DPRL) is an algorithm that restricts the set of state-action pairs or regions for continuous states considered for improvement to ensure high-confidence improvement in densely visited states, while utilizing data from sparsely visited states for trajectory-based value estimates.

Authors

Person: Samuel Tesfazgi, Leonhard Sprandl, Sandra Hirche Organization: AISTATS
Track: Poster Session 3 - aistats 2026

Sources

Track: Poster Session 3 - aistats 2026 virtual.aistats.org Samuel Tesfazgi, Leonhard Sprandl, Sandra Hirche · AISTATS via serper

Referenced by nodes (1)

reinforcement learning concept