Findings Poster Fri, Jun 5, 2026 • 6:00 AM – 7:30 AM PDT ExHall A 274

A Comprehensive Study on Visual Token Redundancy for Discrete Diffusion-based Multimodal Large Language Models

Duo Li, Zuhao Yang, Xiaoqin Zhang, Ling Shao, Shijian Lu

Keywords: Efficient and Scalable Vision