Seongryong Jung

SeongryongJung

1 3 4

https://jungseongryong.github.io/

AI & ML interests

Post-training, Knowledge Distillation, Self-Evolving AI

Recent Activity

updated a model about 21 hours ago

SeongryongJung/Qwen3-8B-Tooluse-RLSD-TR

published a model about 21 hours ago

SeongryongJung/Qwen3-8B-Tooluse-RLSD-TR

updated a model about 23 hours ago

SeongryongJung/Qwen3-8B-Material-RLSD-TR

View all activity

Organizations

None yet

Collections 7

View 7 collections

Papers 1

arxiv:2505.16297

models 101

datasets 6

SeongryongJung/information-asymmetry-qwen3-4b

Updated 8 days ago • 2.08k

SeongryongJung/opsd-plain-4b-rollouts

Viewer • Updated 26 days ago • 748 • 84

SeongryongJung/opsd-plain-8b-rollouts

Viewer • Updated 26 days ago • 768 • 82

SeongryongJung/factory-agent-rollouts

Preview • Updated Jun 2 • 35

SeongryongJung/powerplant-shortqa-rows-4001-5000

Viewer • Updated May 7 • 3k • 22

SeongryongJung/medical-o1-reasoning-sft-gpt-4.1-mini-rewrite-hints

Viewer • Updated Apr 30 • 19.7k • 21

Seongryong Jung

AI & ML interests

Recent Activity

Organizations

Collections 7

SeongryongJung/Qwen3-4B-Tooluse-GRPO-TR

SeongryongJung/Qwen3-4B-Tooluse-RLSD-TR

SeongryongJung/Qwen3-4B-ToolUse-SDPO-TR

SeongryongJung/Qwen3-4B-ToolUse-SRPO-TR

SeongryongJung/Qwen3-4B-Material-GRPO-TR

SeongryongJung/Qwen3-4B-Material-RLSD-TR

SeongryongJung/Qwen3-4B-Materials-SDPO-TR

SeongryongJung/Qwen3-4B-Materials-SRPO-TR

SeongryongJung/Qwen3-4B-Tooluse-GRPO-TR

SeongryongJung/Qwen3-4B-Tooluse-RLSD-TR

SeongryongJung/Qwen3-4B-ToolUse-SDPO-TR

SeongryongJung/Qwen3-4B-ToolUse-SRPO-TR

SeongryongJung/Qwen3-4B-Material-GRPO-TR

SeongryongJung/Qwen3-4B-Material-RLSD-TR

SeongryongJung/Qwen3-4B-Materials-SDPO-TR

SeongryongJung/Qwen3-4B-Materials-SRPO-TR

Papers 1

models 101

SeongryongJung/Qwen3-8B-Tooluse-RLSD-TR

SeongryongJung/Qwen3-8B-Material-RLSD-TR

SeongryongJung/Qwen3-8B-Material-GRPO-TR

SeongryongJung/Qwen3-8B-Biology-RLSD-TR

SeongryongJung/Qwen3-8B-Biology-GRPO-TR

SeongryongJung/Qwen3-8B-ToolUse-SRPO-TR

SeongryongJung/Qwen3-8B-ToolUse-SDPO-TR

SeongryongJung/Qwen3-8B-Materials-SRPO-TR

SeongryongJung/Qwen3-8B-Physics-RLSD-TR

SeongryongJung/Qwen3-8B-Physics-GRPO-TR

datasets 6

SeongryongJung/information-asymmetry-qwen3-4b

SeongryongJung/opsd-plain-4b-rollouts

SeongryongJung/opsd-plain-8b-rollouts

SeongryongJung/factory-agent-rollouts

SeongryongJung/powerplant-shortqa-rows-4001-5000

SeongryongJung/medical-o1-reasoning-sft-gpt-4.1-mini-rewrite-hints

Seongryong Jung

AI & ML interests

Recent Activity

Organizations

Collections 7

Papers 1

models 101 Sort: Recently updated

datasets 6 Sort: Recently updated

models 101

datasets 6