Weiguo Pian's Homepage

About Me

I'm a Ph.D. candidate at The University of Texas at Dallas, advised by Prof. Yapeng Tian and Prof. Yunhui Guo. Before that, I received my master and bachelor degree from Chongqing University, China in 2021 and 2018 respectively.

My research interests lie in machine learning and computer vision, focusing on Audio-Visual Learning, Continual Learning, Multimodal Large Language Models, and Generative Models, etc.

News

[Feb. 2026]: Two papers got accepted at CVPR 2026, and one paper got accepted by TMLR.

[May 2025]: Join Amazon Prime Video as an Applied Scientist Intern.

[Sep. 2024]: Our paper on continual audio-visual sound separation got accepted at NeurIPS 2024.

[May 2024]: Start my internship at Tencent AI Lab Seattle.

[July 2023]: Two papers got accepted at ICCV 2023.

[Nov. 2022]: One paper got accepted at AAAI 2023.

[Aug. 2021]: Join Cognitive Computing Laboratory (CCL), Baidu Research as a research intern.

Education

Ph.D. student, Computer Science
Department of Computer Science, The University of Texas at Dallas
Aug. 2023 - Present

Ph.D., Computer Science
SnT, University of Luxembourg, Luxembourg
Jan. 2022 - Sep. 2025

M.Eng., Vehicle Engineering
Automotive Collaborative Innovation Center, Chongqing University, China
Sep. 2018 - Jun. 2021

B.Eng., Software Engineering
School of Big Data & Software Engineering, Chongqing University, China
Sep. 2014 - Jun. 2018

Working Experience

Amazon Prime Video, Seattle
Applied Scientist Intern
May 2025 - Aug. 2025

Tencent AI Lab, Bellevue
Research Intern
May 2024 - Aug. 2024

Cognitive Computing Lab (CCL), Baidu Research, Beijing
Research Intern
Aug. 2021 - Nov. 2021

Mobile Ecosystem Group (MEG), Baidu Inc., Beijing
Computer Vision R&D Intern
Jun. 2020 - Dec. 2020

Selected Publications

^‡ indicates equal contribution.

OmniSonic: Towards Universal and Holistic Audio Generation from Video and Text
Weiguo Pian, Saksham Singh Kushwaha, Zhimin Chen, Shijian Deng, Kai Wang, Yunhui Guo, Yapeng Tian
IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2026
Hear What You See: Video-to-Audio Generation with Diffusion Transformer and Semantic-Temporal Alignment-Ranked Direct Preference Optimization
Kai Wang, Tao Zhou, Jiayi Lei, Jing Wang, Jinman Zhao, Weiguo Pian, Yuan Cheng, Yapeng Tian, Peng Gao, Bin Fu, Yihao Liu, Dimitrios Hatzinakos, Yuewen Cao
IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2026
Towards Online Multimodal Social Interaction Understanding
Xinpeng Li, Shijian Deng, Bolin Lai, Weiguo Pian, James Matthew Rehg, Yapeng Tian
Transactions on Machine Learning Research (TMLR), 2026
You Don't Have to Say Where to Edit! jLED – Joint Learning to Localize and Edit Source Code
Weiguo Pian^‡, Yinghua Li^‡, Haoye Tian, Tiezhu Sun, Yewei Song, Xunzhu Tang, Andrew Habib, Jacques Klein, Tegawendé F. Bissyandé
ACM Transactions on Software Engineering and Methodology (TOSEM), 2025
Modality-Inconsistent Continual Learning of Multimodal Large Language Models
Weiguo Pian, Shijian Deng, Shentong Mo, Yunhui Guo, Yapeng Tian
arXiv:2412.13050, 2024
Continual Audio-Visual Sound Separation
Weiguo Pian, Yiyang Nan, Shijian Deng, Shentong Mo, Yunhui Guo, Yapeng Tian
Annual Conference on Neural Information Processing Systems (NeurIPS), 2024
Audio-Visual Class-Incremental Learning
Weiguo Pian^‡, Shentong Mo^‡, Yunhui Guo, Yapeng Tian
IEEE/CVF International Conference on Computer Vision (ICCV), 2023
Class-Incremental Grouping Network for Continual Audio-Visual Learning
Shentong Mo^‡, Weiguo Pian^‡, Yapeng Tian
IEEE/CVF International Conference on Computer Vision (ICCV), 2023
MetaTPTrans: A Meta Learning Approach for Multilingual Code Representation Learning
Weiguo Pian, Hanyu Peng, Xunzhu Tang, Tiezhu Sun, Haoye Tian, Andrew Habib, Jacques Klein, Tegawendé F. Bissyandé
AAAI Conference on Artificial Intelligence (AAAI), 2023
Dynamic Re-weighting for Long-tailed Semi-supervised Learning
Hanyu Peng, Weiguo Pian, Mingming Sun, Ping Li
IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 2023
Predicting Patch Correctness Based on the Similarity of Failing Test Cases
Haoye Tian, Yinghua Li, Weiguo Pian, Abdoul Kader Kaboré, Kui Liu, Andrew Habib, Jacques Klein, Tegawendé F. Bissyandé
ACM Transactions on Software Engineering and Methodology (TOSEM), 2022

Academic Services

Conference reviewer:
ECML-PKDD 2020, ICML 2022 2025, NeurIPS 2022-2025, ECAI 2023, AAAI 2024-2026, ICLR 2024-2026, CVPR 2024-2026, ECCV 2024, ICCV 2025.

Journal Reviewer:
IEEE T-CSVT, Frontiers of Computer Science, IJCV.

Teaching

UT Dallas
- Spring 2024 - CS 6384: Computer Vision, Teaching Assistant
- Fall 2023 - CS 6331: Multimedia Systems, Teaching Assistant
- Fall 2023 - CS 4390: Computer Networks, Teaching Assistant

Weiguo Pian Ph.D. Candidate Computer Vision and Multimodal Computing Lab Data Efficient Intelligent Learning Lab The University of Texas at Dallas