RL - Reinforcement Learning - a ljupco Collection

ljupco 's Collections

RL - Reinforcement Learning

agents

context, prompt

speed efficiency gains

RL - Reinforcement Learning

updated Oct 20

QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs

Paper • 2510.11696 • Published Oct 13 • 176
Demystifying Reinforcement Learning in Agentic Reasoning

Paper • 2510.11701 • Published Oct 13 • 31