XiaopeiWan's picture

1 3

XiaopeiWan

XiaopeiWan

AI & ML interests

None yet

Organizations

None yet

authored 3 papers 3 months ago

Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs

Paper • 2506.14731 • Published Jun 17, 2025 • 8

Every Step Evolves: Scaling Reinforcement Learning for Trillion-Scale Thinking Model

Paper • 2510.18855 • Published Oct 21, 2025 • 71

LogicMP: A Neuro-symbolic Approach for Encoding First-order Logic Constraints

Paper • 2309.15458 • Published Sep 27, 2023 • 1