Findings Poster Fri, Jun 5, 2026 • 6:00 AM – 7:30 AM PDT ExHall A 270

RedVTP: Training-Free Acceleration of Diffusion Vision-Language Models Inference via Masked Token-Guided Visual Token Pruning

Jingqi Xu, Jingxi Lu, Chenghao Li, Sreetama Sarkar, Souvik Kundu, Peter A Beerel

Keywords: Efficient and Scalable Vision