3 5 8

Sang-Hoon Lee

LeeSangHoon

https://github.com/sh-lee-prml

sh-lee-prml

AI & ML interests

Speech Synthesis

Recent Activity

liked a model 1 day ago

YatharthS/FlashSR

liked a dataset 12 days ago

aanonyyy/F5I9N7A1

upvoted a paper over 1 year ago

EzAudio: Enhancing Text-to-Audio Generation with Efficient Diffusion Transformer

View all activity

Organizations

None yet

liked a model 1 day ago

YatharthS/FlashSR

Audio-to-Audio • Updated 3 days ago • 32

liked a dataset 12 days ago

aanonyyy/F5I9N7A1

Viewer • Updated Oct 22 • 126k • 498 • 76

upvoted 2 papers over 1 year ago

EzAudio: Enhancing Text-to-Audio Generation with Efficient Diffusion Transformer

Paper • 2409.10819 • Published Sep 17, 2024 • 18

Audio Match Cutting: Finding and Creating Matching Audio Transitions in Movies and Videos

Paper • 2408.10998 • Published Aug 20, 2024 • 9

authored 3 papers over 1 year ago

Accelerating High-Fidelity Waveform Generation via Adversarial Flow Matching Optimization

Paper • 2408.08019 • Published Aug 15, 2024 • 11

PeriodWave: Multi-Period Flow Matching for High-Fidelity Waveform Generation

Paper • 2408.07547 • Published Aug 14, 2024 • 8

DDDM-VC: Decoupled Denoising Diffusion Models with Disentangled Representation and Prior Mixup for Verified Robust Voice Conversion

Paper • 2305.15816 • Published May 25, 2023

upvoted 2 papers over 1 year ago

PeriodWave: Multi-Period Flow Matching for High-Fidelity Waveform Generation

Paper • 2408.07547 • Published Aug 14, 2024 • 8

Accelerating High-Fidelity Waveform Generation via Adversarial Flow Matching Optimization

Paper • 2408.08019 • Published Aug 15, 2024 • 11

liked a Space over 1 year ago

UTMOSv2

🌖

Generate speech quality score from audio

liked a dataset over 1 year ago

MushanW/GLOBE

Viewer • Updated May 21 • 582k • 1.54k • 30

liked a Space almost 2 years ago

XTTS

🐸

2.77k

Generate speech from text using a reference voice

New activity in LeeSangHoon/HierSpeech_TTS about 2 years ago

Multilingual model

#3 opened about 2 years ago by

sdnpty

liked a model about 2 years ago

facebook/mms-300m

Updated Jun 5, 2023 • 62.3k • 36

authored a paper about 2 years ago

HierSpeech++: Bridging the Gap between Semantic and Acoustic Representation of Speech by Hierarchical Variational Inference for Zero-shot Speech Synthesis

Paper • 2311.12454 • Published Nov 21, 2023 • 30

liked a Space about 2 years ago

Lp Music Caps

🎵

170

Generate captions for music audio

upvoted a paper about 2 years ago

HierSpeech++: Bridging the Gap between Semantic and Acoustic Representation of Speech by Hierarchical Variational Inference for Zero-shot Speech Synthesis

Paper • 2311.12454 • Published Nov 21, 2023 • 30

updated a Space about 2 years ago

HierSpeech++ (Zero-shot TTS)

⚡

398

Generate high-quality speech from text using a prompt audio

liked a Space about 2 years ago

HierSpeech++ (Zero-shot TTS)

⚡

398

Generate high-quality speech from text using a prompt audio

New activity in LeeSangHoon/HierSpeech_TTS about 2 years ago

Apply for community grant: Academic project (gpu)

#1 opened about 2 years ago by

LeeSangHoon

Sang-Hoon Lee

AI & ML interests

Recent Activity

Organizations

LeeSangHoon's activity

UTMOSv2

XTTS

Multilingual model

Lp Music Caps

HierSpeech++ (Zero-shot TTS)

HierSpeech++ (Zero-shot TTS)

Apply for community grant: Academic project (gpu)