Papers

Harmonizing Visual Representations for Unified Multimodal Understanding and Generation
Size Wu, Wenwei Zhang, Lumin Xu, Sheng Jin, Zhonghua Wu, Qingyi Tao, Wentao Liu, Wei Li and Chen Change Loy
International Conference on Computer Vision (ICCV) , 2025
[Paper] [Code]

F-LMM: Grounding Frozen Large Multimodal Models
Size Wu, Sheng Jin, Wenwei Zhang, Lumin Xu, Wentao Liu, Wei Li and Chen Change Loy
IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , 2025
[Paper] [Code]

CLIPSelf: Vision Transformer Distills Itself for Open-Vocabulary Dense Prediction
Size Wu, Wenwei Zhang, Lumin Xu, Sheng Jin, Xiangtai Li, Wentao Liu and Chen Change Loy
International Conference on Learning Representations (ICLR) , 2024
Spotlight (top 5%)
[Paper] [Code]

CLIM: Contrastive Language-Image Mosaic for Region Representation
Size Wu, Wenwei Zhang, Lumin Xu, Sheng Jin, Wentao Liu and Chen Change Loy
Association for the Advancement of Artificial Intelligence (AAAI) , 2024
[Paper] [Code]

Aligning Bag of Regions for Open-Vocabulary Object Detection
Size Wu, Wenwei Zhang, Sheng Jin, Wentao Liu, Chen Change Loy
IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , 2023
[Paper] [Code] [Project Page]

Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images
Size Wu, Sheng Jin, Wentao Liu, Lei Bai, Chen Qian, Dong Liu, and Wanli Ouyang
International Conference on Computer Vision (ICCV) , 2021
[Paper] [Code]

Size Wu (吴思泽)

Papers