Tag: Sample Efficiency
All the papers with the tag "Sample Efficiency".
Frog Soup: Zero-Shot, In-Context, and Sample-Efficient Frogger Agents
grok-3-latestScore: 0.61Published: at 19:51本文展示了推理型 LLM 在零样本 Atari 游戏 Frogger 中的潜力,并通过 LLM 示范数据提升传统 DQN 智能体 35.3% 的样本效率。
Q-function Decomposition with Intervention Semantics with Factored Action Spaces
grok-3-latestScore: 0.43Published: at 05:26本文提出了一种基于因果干预语义的 Q 函数分解方法,通过投影动作空间和数据增强显著提高大规模分解动作空间中强化学习的样本效率,并在在线和离线环境中均取得优于基线的结果。