Jeongsoo Choi

Publications

2025

Deep Understanding of Sign Language for Sign to Subtitle Alignment
Youngjoon Jang*, Jeongsoo Choi*, Junseok Ahn, Joon Son Chung
IEEE Transactions on Multimedia (TMM)
[ paper ]
Dub-S2ST: Textless Speech-to-Speech Translation for Seamless Dubbing
Jeongsoo Choi*, Jaehun Kim*, Joon Son Chung
EMNLP 2025 Findings
[ paper ]
AlignDiT: Multimodal Aligned Diffusion Transformer for Synchronized Speech Generation
Jeongsoo Choi, Ji-Hoon Kim, Kim Sung-Bin, Tae-Hyun Oh, Joon Son Chung
ACM MM 2025
[ paper | code | demo ]
VoiceCraft-Dub: Automated Video Dubbing with Neural Codec Language Models
Kim Sung-Bin, Jeongsoo Choi, Puyuan Peng, Joon Son Chung, Tae-Hyun Oh, David Harwath
ICCV 2025
[ paper | demo ]
MAVFlow: Preserving Paralinguistic Elements with Conditional Flow Matching for Zero-Shot AV2AV Multilingual Translation
Sungwoo Cho, Jeongsoo Choi, Sungnyun Kim, Se-Young Yun
ICCV 2025
[ paper ]
Accelerating Diffusion-based Text-to-Speech Model Training with Dual Modality Alignment
Jeongsoo Choi*, Zhikang Niu*, Ji-Hoon Kim, Chunhui Wang, Joon Son Chung, Xie Chen
Interspeech 2025
[ paper | code | demo ]
From Faces to Voices: Learning Hierarchical Representations for High-quality Video-to-Speech
Ji-Hoon Kim, Jeongsoo Choi, Jaehun Kim, Chaeyoung Jung, Joon Son Chung
CVPR 2025 Highlight presentation
[ paper | demo ]
ARLON: Boosting Diffusion Transformers with Autoregressive Models for Long Video Generation
Zongyi Li*, Shujie Hu*, Shujie Liu, Long Zhou, Jeongsoo Choi, Lingwei Meng, Xun Guo, Jinyu Li, Hefei Ling, Furu Wei
ICLR 2025
[ paper | demo ]
V2SFlow: Video-to-Speech Generation with Speech Decomposition and Rectified Flow
Jeongsoo Choi*, Ji-Hoon Kim*, Jinyu Li, Joon Son Chung, Shujie Liu
ICASSP 2025
[ paper | demo ]
Accelerating Codec-based Speech Synthesis with Multi-Token Prediction and Speculative Decoding
Tan Dat Nguyen, Ji-Hoon Kim, Jeongsoo Choi, Shukjae Choi, Jinseok Park, Younglo Lee, Joon Son Chung
ICASSP 2025
[ paper | demo ]

2024

Textless Unit-to-Unit training for Many-to-Many Multilingual Speech-to-Speech Translation
Minsu Kim*, Jeongsoo Choi*, Dahun Kim, and Yong Man Ro
IEEE/ACM Transactions on Audio, Speech, and Language Processing (TASLP)
[ paper | code | demo ]
AV2AV: Direct Audio-Visual Speech to Audio-Visual Speech Translation with Unified Audio-Visual Speech Representation
Jeongsoo Choi*, Se Jin Park*, Minsu Kim*, and Yong Man Ro
CVPR 2024 Highlight presentation
[ paper | code | demo ]
Text-driven Talking Face Synthesis by Reprogramming Audio-driven Models
Jeongsoo Choi, Minsu Kim, Se Jin Park, and Yong Man Ro
ICASSP 2024
[ paper | demo ]
Towards Practical and Efficient Image-to-Speech Captioning with Vision-Language Pre-training and Multi-modal Tokens
Minsu Kim, Jeongsoo Choi, Soumi Maiti, Jeong Hun Yeo, Shinji Watanabe, Yong Man Ro
ICASSP 2024
[ paper | code | demo ]
Exploring Phonetic Context-Aware Lip-Sync For Talking Face Generation
Se Jin Park, Minsu Kim, Jeongsoo Choi, and Yong Man Ro
ICASSP 2024
[ paper ]
AKVSR: Audio Knowledge Empowered Visual Speech Recognition by Compressing Audio Knowledge of a Pretrained Model
Jeong Hun Yeo, Minsu Kim, Jeongsoo Choi, Dae Hoe Kim, and Yong Man Ro
IEEE Transactions on Multimedia (TMM)
[ paper ]

2023

DiffV2S: Diffusion-based Video-to-Speech Synthesis with Vision-guided Speaker Embedding
Jeongsoo Choi*, Joanna Hong*, and Yong Man Ro
ICCV 2023
[ paper | demo ]
Lip Reading for Low-resource Languages by Learning and Combining General Speech Knowledge and Language-specific Knowledge
Minsu Kim*, Jeong Hun Yeo*, Jeongsoo Choi, and Yong Man Ro
ICCV 2023
[ paper ]
Intelligible Lip-to-Speech Synthesis with Speech Units
Jeongsoo Choi, Minsu Kim, and Yong Man Ro
Interspeech 2023
[ paper | code | demo ]
Watch or Listen: Robust Audio-Visual Speech Recognition With Visual Corruption Modeling and Reliability Scoring
Joanna Hong*, Minsu Kim*, Jeongsoo Choi, and Yong Man Ro
CVPR 2023
[ paper | code | demo | data ]

2022

SyncTalkFace: Talking Face Generation with Precise Lip-Syncing via Audio-Lip Memory
Se Jin Park, Minsu Kim, Joanna Hong, Jeongsoo Choi, and Yong Man Ro
AAAI 2022 Oral presentation
[ paper ]

Jeongsoo Choi

About Me

Work Experience

Education

Publications

2025

2024

2023

2022

Awards & Honors

Academic Services

Conference Reviewer

Journal Reviewer