pm-25

AI & ML interests

None defined yet.

Collections 1

models 7

pm-25/llama3-8b-dpo_clean

Text Generation • Updated Sep 27, 2025

pm-25/llama3-8b-grpo

Text Generation • Updated Sep 27, 2025

pm-25/llama3-8b-sft-initial

Text Generation • Updated Sep 27, 2025

pm-25/llama3-8b-sft

Text Generation • Updated Sep 27, 2025

pm-25/llama3-8b-sft-grpo

Text Generation • 8B • Updated Sep 15, 2025 • 2

pm-25/llama3-8b-sft-dpo-tulu-only

Text Generation • 8B • Updated Sep 15, 2025 • 1

pm-25/llama3-8b-sft-dpo

Text Generation • 8B • Updated Sep 15, 2025 • 1

datasets 2

pm-25/clembench-rlvr-dataset-full-patched

Viewer • Updated Sep 22, 2025 • 27.6k • 3

pm-25/clembench-rlvr-dataset

Viewer • Updated Aug 5, 2025 • 35k • 7