Findings Poster Sun, Jun 7, 2026 • 6:30 AM – 8:00 AM PDT ExHall A 169

ForestPrune: High-ratio Visual Token Compression for Video Multimodal Large Language Models Via Spatial-Temporal Forest Modeling

Shaobo Ju, Baiyang Song, Tao Chen, Jiapeng Zhang, Qiong Wu, Chao Chang, Huaixi Wang, Yiyi Zhou, Rongrong Ji

Keywords: Video: Action and Event Understanding