CVPR 2023 Thursday 06/22

Timezone: America/Vancouver

Full Schedule Sun 6/18 Mon 6/19 Tue 6/20 Wed 6/21 Thu 6/22

Invited Talk

Modeling Atoms to Address Our Climate Crisis

Larry Zitnick

9:00 AM - 10:00 AM

Climate change is a societal and political problem whose impact could be mitigated by technology. Underlying many technical challenges is a surprisingly simple yet challenging problem; modeling the interaction of atoms. Approaching this problem from the perspective of a computer vision researcher has the potential to offer new insights into this growing and impactful field.

... more

Speaker Bio

Larry Zitnick is a research director on the Fundamental AI Research team at Meta. He is currently focused on scientific applications of AI and machine learning, such as the discovery of new catalysts for renewable energy applications. Previously, his research in computer vision covered many areas such as the FastMRI project to speed up the acquisition of MRIs, and the COCO and VQA datasets to benchmark object detection and visual language tasks. He developed the PhotoDNA technology used by industry and various law enforcement agencies to combat illegal imagery on the web. Before joining FAIR, he was a principal researcher at Microsoft Research. He received the PhD degree in robotics from Carnegie Mellon University.

... more

Poster

Poster Session THU-AM

10:30 AM - 12:00 PM

393 Events in this session

Fresnel Microfacet BRDF: Unification of Polari-Radiometric Surface-Body Reflection

Tomoki Ichikawa ⋅ Yoshiki Fukao ⋅ Shohei Nobuhara ⋅ Ko Nishino

JacobiNeRF: NeRF Shaping With Mutual Information Gradients

Xiaomeng Xu ⋅ Yanchao Yang ⋅ Kaichun Mo ⋅ Boxiao Pan ⋅ Li Yi ⋅ Leonidas Guibas

ContraNeRF: Generalizable Neural Radiance Fields for Synthetic-to-Real Novel View Synthesis via Contrastive Learning

Hao Yang ⋅ Lanqing Hong ⋅ Aoxue Li ⋅ Tianyang Hu ⋅ Zhenguo Li ⋅ Gim Hee Lee ⋅ Liwei Wang

SCADE: NeRFs from Space Carving With Ambiguity-Aware Depth Estimates

Mikaela Angelina Uy ⋅ Ricardo Martin-Brualla ⋅ Leonidas Guibas ⋅ Ke Li

Removing Objects From Neural Radiance Fields

Silvan Weder ⋅ Guillermo Garcia-Hernando ⋅ Áron Monszpart ⋅ Marc Pollefeys ⋅ Gabriel J. Brostow ⋅ Michael Firman ⋅ Sara Vicente

Progressively Optimized Local Radiance Fields for Robust View Synthesis

Andréas Meuleman ⋅ Yu-Lun Liu ⋅ Chen Gao ⋅ Jia-Bin Huang ⋅ Changil Kim ⋅ Min H. Kim ⋅ Johannes Kopf

NeRFVS: Neural Radiance Fields for Free View Synthesis via Geometry Scaffolds

Chen Yang ⋅ Peihao Li ⋅ Zanwei Zhou ⋅ Shanxin Yuan ⋅ Bingbing Liu ⋅ Xiaokang Yang ⋅ Weichao Qiu ⋅ Wei Shen

ABLE-NeRF: Attention-Based Rendering With Learnable Embeddings for Neural Radiance Field

Zhe Jun Tang ⋅ Tat-Jen Cham ⋅ Haiyu Zhao

MobileNeRF: Exploiting the Polygon Rasterization Pipeline for Efficient Neural Field Rendering on Mobile Architectures

Zhiqin Chen ⋅ Thomas Funkhouser ⋅ Peter Hedman ⋅ Andrea Tagliasacchi

pCON: Polarimetric Coordinate Networks for Neural Scene Representations

Henry Peters ⋅ Yunhao Ba ⋅ Achuta Kadambi

Balanced Spherical Grid for Egocentric View Synthesis

Changwoon Choi ⋅ Sang Min Kim ⋅ Young Min Kim

Complementary Intrinsics From Neural Radiance Fields and CNNs for Outdoor Scene Relighting

Siqi Yang ⋅ Xuanning Cui ⋅ Yongjie Zhu ⋅ Jiajun Tang ⋅ Si Li ⋅ Zhaofei Yu ⋅ Boxin Shi

HyperReel: High-Fidelity 6-DoF Video With Ray-Conditioned Sampling

Benjamin Attal ⋅ Jia-Bin Huang ⋅ Christian Richardt ⋅ Michael Zollhöfer ⋅ Johannes Kopf ⋅ Matthew O’Toole ⋅ Changil Kim

UV Volumes for Real-Time Rendering of Editable Free-View Human Performance

Yue Chen ⋅ Xuan Wang ⋅ Xingyu Chen ⋅ Qi Zhang ⋅ Xiaoyu Li ⋅ Yu Guo ⋅ Jue Wang ⋅ Fei Wang

Tensor4D: Efficient Neural 4D Decomposition for High-Fidelity Dynamic Reconstruction and Rendering

Ruizhi Shao ⋅ Zerong Zheng ⋅ Hanzhang Tu ⋅ Boning Liu ⋅ Hongwen Zhang ⋅ Yebin Liu

PixHt-Lab: Pixel Height Based Light Effect Generation for Image Compositing

Yichen Sheng ⋅ Jianming Zhang ⋅ Julien Philip ⋅ Yannick Hold-Geoffroy ⋅ Xin Sun ⋅ He Zhang ⋅ Lu Ling ⋅ Bedrich Benes

Computational Flash Photography Through Intrinsics

Sepideh Sarajian Maralan ⋅ Chris Careaga ⋅ Yağiz Aksoy

RelightableHands: Efficient Neural Relighting of Articulated Hand Models

Shun Iwase ⋅ Shunsuke Saito ⋅ Tomas Simon ⋅ Stephen Lombardi ⋅ Timur Bagautdinov ⋅ Rohan Joshi ⋅ Fabian Prada ⋅ Takaaki Shiratori ⋅ Yaser Sheikh ⋅ Jason Saragih

TMO: Textured Mesh Acquisition of Objects With a Mobile Device by Using Differentiable Rendering

Jaehoon Choi ⋅ Dongki Jung ⋅ Taejae Lee ⋅ Sangwook Kim ⋅ Youngdong Jung ⋅ Dinesh Manocha ⋅ Donghwan Lee

VolRecon: Volume Rendering of Signed Ray Distance Functions for Generalizable Multi-View Reconstruction

Yufan Ren ⋅ Fangjinhua Wang ⋅ Tong Zhang ⋅ Marc Pollefeys ⋅ Sabine Süsstrunk

Multi-View Reconstruction Using Signed Ray Distance Functions (SRDF)

Pierre Zins ⋅ Yuanlu Xu ⋅ Edmond Boyer ⋅ Stefanie Wuhrer ⋅ Tony Tung

Structural Multiplane Image: Bridging Neural View Synthesis and 3D Reconstruction

Mingfang Zhang ⋅ Jinglu Wang ⋅ Xiao Li ⋅ Yifei Huang ⋅ Yoichi Sato ⋅ Yan Lu

Octree Guided Unoriented Surface Reconstruction

Chamin Hewa Koneputugodage ⋅ Yizhak Ben-Shabat ⋅ Stephen Gould

Neural Vector Fields: Implicit Representation by Explicit Learning

Xianghui Yang ⋅ Guosheng Lin ⋅ Zhenghao Chen ⋅ Luping Zhou

DA Wand: Distortion-Aware Selection Using Neural Mesh Parameterization

Richard Liu ⋅ Noam Aigerman ⋅ Vladimir G. Kim ⋅ Rana Hanocka

Diffusion-Based Generation, Optimization, and Planning in 3D Scenes

Siyuan Huang ⋅ Zan Wang ⋅ Puhao Li ⋅ Baoxiong Jia ⋅ Tengyu Liu ⋅ Yixin Zhu ⋅ Wei Liang ⋅ Song-Chun Zhu

Patch-Based 3D Natural Scene Generation From a Single Example

Weiyu Li ⋅ Xuelin Chen ⋅ Jue Wang ⋅ Baoquan Chen

Consistent View Synthesis With Pose-Guided Diffusion Models

Hung-Yu Tseng ⋅ Qinbo Li ⋅ Changil Kim ⋅ Suhib Alsisan ⋅ Jia-Bin Huang ⋅ Johannes Kopf

Generalized Deep 3D Shape Prior via Part-Discretized Diffusion Process

Yuhan Li ⋅ Yishun Dou ⋅ Xuanhong Chen ⋅ Bingbing Ni ⋅ Yilin Sun ⋅ Yutian Liu ⋅ Fuzhen Wang

High Fidelity 3D Hand Shape Reconstruction via Scalable Graph Frequency Decomposition

Tianyu Luan ⋅ Yuanhao Zhai ⋅ Jingjing Meng ⋅ Zhong Li ⋅ Zhang Chen ⋅ Yi Xu ⋅ Junsong Yuan

TAPS3D: Text-Guided 3D Textured Shape Generation From Pseudo Supervision

Jiacheng Wei ⋅ Hao Wang ⋅ Jiashi Feng ⋅ Guosheng Lin ⋅ Kim-Hui Yap

SECAD-Net: Self-Supervised CAD Reconstruction by Learning Sketch-Extrude Operations

Pu Li ⋅ Jianwei Guo ⋅ Xiaopeng Zhang ⋅ Dong-Ming Yan

Interactive Cartoonization With Controllable Perceptual Factors

Namhyuk Ahn ⋅ Patrick Kwon ⋅ Jihye Back ⋅ Kibeom Hong ⋅ Seungkwon Kim

High-Res Facial Appearance Capture From Polarized Smartphone Images

Dejan Azinović ⋅ Olivier Maury ⋅ Christophe Hery ⋅ Matthias Nießner ⋅ Justus Thies

GlassesGAN: Eyewear Personalization Using Synthetic Appearance Discovery and Targeted Subspace Modeling

Richard Plesh ⋅ Peter Peer ⋅ Vitomir Struc

Continuous Landmark Detection With 3D Queries

Prashanth Chandran ⋅ Gaspard Zoss ⋅ Paulo Gotardo ⋅ Derek Bradley

NeuFace: Realistic 3D Neural Face Rendering From Multi-View Images

Mingwu Zheng ⋅ Haiyu Zhang ⋅ Hongyu Yang ⋅ Di Huang

AVFace: Towards Detailed Audio-Visual 4D Face Reconstruction

Aggelina Chatziagapi ⋅ Dimitris Samaras

Learning Personalized High Quality Volumetric Head Avatars From Monocular RGB Videos

Ziqian Bai ⋅ Feitong Tan ⋅ Zeng Huang ⋅ Kripasindhu Sarkar ⋅ Danhang Tang ⋅ Di Qiu ⋅ Abhimitra Meka ⋅ Ruofei Du ⋅ Mingsong Dou ⋅ Sergio Orts-Escolano ⋅ Rohit Pandey ⋅ Ping Tan ⋅ Thabo Beeler ⋅ Sean Fanello ⋅ Yinda Zhang

OTAvatar: One-Shot Talking Face Avatar With Controllable Tri-Plane Rendering

Zhiyuan Ma ⋅ Xiangyu Zhu ⋅ Guo-Jun Qi ⋅ Zhen Lei ⋅ Lei Zhang

X-Avatar: Expressive Human Avatars

Kaiyue Shen ⋅ Chen Guo ⋅ Manuel Kaufmann ⋅ Juan Jose Zarate ⋅ Julien Valentin ⋅ Jie Song ⋅ Otmar Hilliges

InstantAvatar: Learning Avatars From Monocular Video in 60 Seconds

Tianjian Jiang ⋅ Xu Chen ⋅ Jie Song ⋅ Otmar Hilliges

JAWS: Just a Wild Shot for Cinematic Transfer in Neural Radiance Fields

Xi Wang ⋅ Robin Courant ⋅ Jinglei Shi ⋅ Eric Marchand ⋅ Marc Christie

MonoHuman: Animatable Human Neural Field From Monocular Video

Zhengming Yu ⋅ Wei Cheng ⋅ Xian Liu ⋅ Wayne Wu ⋅ Kwan-Yee Lin

Structured 3D Features for Reconstructing Controllable Avatars

Enric Corona ⋅ Mihai Zanfir ⋅ Thiemo Alldieck ⋅ Eduard Gabriel Bazavan ⋅ Andrei Zanfir ⋅ Cristian Sminchisescu

HOOD: Hierarchical Graphs for Generalized Modelling of Clothing Dynamics

Artur Grigorev ⋅ Michael J. Black ⋅ Otmar Hilliges

Physically Realizable Natural-Looking Clothing Textures Evade Person Detectors via 3D Modeling

Zhanhao Hu ⋅ Wenda Chu ⋅ Xiaopei Zhu ⋅ Hui Zhang ⋅ Bo Zhang ⋅ Xiaolin Hu

Learning Semantic-Aware Disentangled Representation for Flexible 3D Human Body Editing

Xiaokun Sun ⋅ Qiao Feng ⋅ Xiongzheng Li ⋅ Jinsong Zhang ⋅ Yu-Kun Lai ⋅ Jingyu Yang ⋅ Kun Li

Reconstructing Animatable Categories From Videos

Gengshan Yang ⋅ Chaoyang Wang ⋅ N. Dinesh Reddy ⋅ Deva Ramanan

Deformable Mesh Transformer for 3D Human Mesh Recovery

Yusuke Yoshiyasu

Hi4D: 4D Instance Segmentation of Close Human Interaction

Yifei Yin ⋅ Chen Guo ⋅ Manuel Kaufmann ⋅ Juan Jose Zarate ⋅ Jie Song ⋅ Otmar Hilliges

Bringing Inputs to Shared Domains for 3D Interacting Hands Recovery in the Wild

Gyeongsik Moon

Learning Human Mesh Recovery in 3D Scenes

Zehong Shen ⋅ Zhi Cen ⋅ Sida Peng ⋅ Qing Shuai ⋅ Hujun Bao ⋅ Xiaowei Zhou

H2ONet: Hand-Occlusion-and-Orientation-Aware Network for Real-Time 3D Hand Mesh Reconstruction

Hao Xu ⋅ Tianyu Wang ⋅ Xiao Tang ⋅ Chi-Wing Fu

What You Can Reconstruct From a Shadow

Ruoshi Liu ⋅ Sachit Menon ⋅ Chengzhi Mao ⋅ Dennis Park ⋅ Simon Stent ⋅ Carl Vondrick

Autonomous Manipulation Learning for Similar Deformable Objects via Only One Demonstration

Yu Ren ⋅ Ronghan Chen ⋅ Yang Cong

In-Hand 3D Object Scanning From an RGB Sequence

Shreyas Hampali ⋅ Tomas Hodan ⋅ Luan Tran ⋅ Lingni Ma ⋅ Cem Keskin ⋅ Vincent Lepetit

Putting People in Their Place: Affordance-Aware Human Insertion Into Scenes

Sumith Kulal ⋅ Tim Brooks ⋅ Alex Aiken ⋅ Jiajun Wu ⋅ Jimei Yang ⋅ Jingwan Lu ⋅ Alexei A. Efros ⋅ Krishna Kumar Singh

Detecting Human-Object Contact in Images

Yixin Chen ⋅ Sai Kumar Dwivedi ⋅ Michael J. Black ⋅ Dimitrios Tzionas

What Happened 3 Seconds Ago? Inferring the Past With Thermal Imaging

Zitian Tang ⋅ Wenjie Ye ⋅ Wei-Chiu Ma ⋅ Hang Zhao

Trajectory-Aware Body Interaction Transformer for Multi-Person Pose Forecasting

Xiaogang Peng ⋅ Siyuan Mao ⋅ Zizhao Wu

Mutual Information-Based Temporal Difference Learning for Human Pose Estimation in Video

Runyang Feng ⋅ Yixing Gao ⋅ Xueqing Ma ⋅ Tze Ho Elden Tse ⋅ Hyung Jin Chang

Ego-Body Pose Estimation via Ego-Head Pose Estimation

Jiaman Li ⋅ Karen Liu ⋅ Jiajun Wu

ViPLO: Vision Transformer Based Pose-Conditioned Self-Loop Graph for Human-Object Interaction Detection

Jeeseung Park ⋅ Jin-Woo Park ⋅ Jong-Seok Lee

HS-Pose: Hybrid Scope Feature Extraction for Category-Level Object Pose Estimation

Linfang Zheng ⋅ Chen Wang ⋅ Yinghan Sun ⋅ Esha Dasgupta ⋅ Hua Chen ⋅ Aleš Leonardis ⋅ Wei Zhang ⋅ Hyung Jin Chang

ScarceNet: Animal Pose Estimation With Scarce Annotations

Chen Li ⋅ Gim Hee Lee

Cross-Domain 3D Hand Pose Estimation With Dual Modalities

Qiuxia Lin ⋅ Linlin Yang ⋅ Angela Yao

Linking Garment With Person via Semantically Associated Landmarks for Virtual Try-On

Keyu Yan ⋅ Tingwei Gao ⋅ Hui Zhang ⋅ Chengjun Xie

Level-S$^2$fM: Structure From Motion on Neural Level Set of Implicit Surfaces

Yuxi Xiao ⋅ Nan Xue ⋅ Tianfu Wu ⋅ Gui-Song Xia

Revisiting Rotation Averaging: Uncertainties and Robust Losses

Ganlin Zhang ⋅ Viktor Larsson ⋅ Daniel Barath

SliceMatch: Geometry-Guided Aggregation for Cross-View Pose Estimation

Zimin Xia ⋅ Zimin Xia ⋅ Ted Lentsch ⋅ Julian F. P. Kooij

Learning the Distribution of Errors in Stereo Matching for Joint Disparity and Uncertainty Estimation

Liyan Chen ⋅ Weihan Wang ⋅ Philippos Mordohai

Long-Term Visual Localization With Mobile Sensors

Shen Yan ⋅ Yu Liu ⋅ Long Wang ⋅ Zehong Shen ⋅ Zhen Peng ⋅ Haomin Liu ⋅ Maojun Zhang ⋅ Guofeng Zhang ⋅ Xiaowei Zhou

Learning To Predict Scene-Level Implicit 3D From Posed RGBD Data

Nilesh Kulkarni ⋅ Linyi Jin ⋅ Justin Johnson ⋅ David F. Fouhey

Paired-Point Lifting for Enhanced Privacy-Preserving Visual Localization

Chunghwan Lee ⋅ Jaihoon Kim ⋅ Chanhyuk Yun ⋅ Je Hyeong Hong

The ObjectFolder Benchmark: Multisensory Learning With Neural and Real Objects

Ruohan Gao ⋅ Yiming Dou ⋅ Hao Li ⋅ Tanmay Agarwal ⋅ Jeannette Bohg ⋅ Yunzhu Li ⋅ Li Fei-Fei ⋅ Jiajun Wu

Learning Accurate 3D Shape Based on Stereo Polarimetric Imaging

Tianyu Huang ⋅ Haoang Li ⋅ Kejing He ⋅ Congying Sui ⋅ Bin Li ⋅ Yun-Hui Liu

RUST: Latent Neural Scene Representations From Unposed Imagery

Mehdi S. M. Sajjadi ⋅ Aravindh Mahendran ⋅ Thomas Kipf ⋅ Etienne Pot ⋅ Daniel Duckworth ⋅ Mario Lučić ⋅ Klaus Greff

Perspective Fields for Single Image Camera Calibration

Linyi Jin ⋅ Jianming Zhang ⋅ Yannick Hold-Geoffroy ⋅ Oliver Wang ⋅ Kevin Blackburn-Matzen ⋅ Matthew Sticha ⋅ David F. Fouhey

VisFusion: Visibility-Aware Online 3D Scene Reconstruction From Videos

Huiyu Gao ⋅ Wei Mao ⋅ Miaomiao Liu

DeepLSD: Line Segment Detection and Refinement With Deep Image Gradients

Rémi Pautrat ⋅ Daniel Barath ⋅ Viktor Larsson ⋅ Martin R. Oswald ⋅ Marc Pollefeys

Disentangling Orthogonal Planes for Indoor Panoramic Room Layout Estimation With Cross-Scale Distortion Awareness

Zhijie Shen ⋅ Zishuo Zheng ⋅ Chunyu Lin ⋅ Lang Nie ⋅ Kang Liao ⋅ Shuai Zheng ⋅ Yao Zhao

Single Image Depth Prediction Made Better: A Multivariate Gaussian Take

Ce Liu ⋅ Suryansh Kumar ⋅ Shuhang Gu ⋅ Radu Timofte ⋅ Luc Van Gool

Wide-Angle Rectification via Content-Aware Conformal Mapping

Qi Zhang ⋅ Hongdong Li ⋅ Qing Wang

All-in-Focus Imaging From Event Focal Stack

Hanyue Lou ⋅ Minggui Teng ⋅ Yixin Yang ⋅ Boxin Shi

Multi-View Stereo Representation Revist: Region-Aware MVSNet

Yisu Zhang ⋅ Jianke Zhu ⋅ Lixiang Lin

Semantic Ray: Learning a Generalizable Semantic Field With Cross-Reprojection Attention

Fangfu Liu ⋅ Chubin Zhang ⋅ Yu Zheng ⋅ Yueqi Duan

OmniCity: Omnipotent City Understanding With Multi-Level and Multi-View Images

Weijia Li ⋅ Yawen Lai ⋅ Linning Xu ⋅ Yuanbo Xiangli ⋅ Jinhua Yu ⋅ Conghui He ⋅ Gui-Song Xia ⋅ Dahua Lin

ESLAM: Efficient Dense SLAM System Based on Hybrid Representation of Signed Distance Fields

Mohammad Mahdi Johari ⋅ Camilla Carta ⋅ François Fleuret

Non-Line-of-Sight Imaging With Signal Superresolution Network

Jianyu Wang ⋅ Xintong Liu ⋅ Leping Xiao ⋅ Zuoqiang Shi ⋅ Lingyun Qiu ⋅ Xing Fu

Look, Radiate, and Learn: Self-Supervised Localisation via Radio-Visual Correspondence

Mohammed Alloulah ⋅ Maximilian Arnold

Learning Transformations To Reduce the Geometric Shift in Object Detection

Vidit Vidit ⋅ Martin Engilberge ⋅ Mathieu Salzmann

Anchor3DLane: Learning To Regress 3D Anchors for Monocular 3D Lane Detection

Shaofei Huang ⋅ Zhenwei Shen ⋅ Zehao Huang ⋅ Zi-han Ding ⋅ Jiao Dai ⋅ Jizhong Han ⋅ Naiyan Wang ⋅ Si Liu

BEV-SAN: Accurate BEV 3D Object Detection via Slice Attention Networks

Xiaowei Chi ⋅ Jiaming Liu ⋅ Ming Lu ⋅ Rongyu Zhang ⋅ Zhaoqing Wang ⋅ Yandong Guo ⋅ Shanghang Zhang

Semi-Supervised Stereo-Based 3D Object Detection via Cross-View Consensus

Wenhao Wu ⋅ Hau San Wong ⋅ Si Wu

Weakly Supervised Monocular 3D Object Detection Using Multi-View Projection and Direction Consistency

Runzhou Tao ⋅ Wencheng Han ⋅ Zhongying Qiu ⋅ Cheng-Zhong Xu ⋅ Jianbing Shen

MonoATT: Online Monocular 3D Object Detection With Adaptive Token Transformer

Yunsong Zhou ⋅ Hongzi Zhu ⋅ Quan Liu ⋅ Shan Chang ⋅ Minyi Guo

Azimuth Super-Resolution for FMCW Radar in Autonomous Driving

Yu-Jhe Li ⋅ Shawn Hunt ⋅ Jinhyung Park ⋅ Matthew O’Toole ⋅ Kris Kitani

Pix2map: Cross-Modal Retrieval for Inferring Street Maps From Images

Xindi Wu ⋅ KwunFung Lau ⋅ Francesco Ferroni ⋅ Aljoša Ošep ⋅ Deva Ramanan

LoGoNet: Towards Accurate 3D Object Detection With Local-to-Global Cross-Modal Fusion

Xin Li ⋅ Tao Ma ⋅ Yuenan Hou ⋅ Botian Shi ⋅ Yuchen Yang ⋅ Youquan Liu ⋅ Xingjiao Wu ⋅ Qin Chen ⋅ Yikang Li ⋅ Yu Qiao ⋅ Liang He

Neural Map Prior for Autonomous Driving

Xuan Xiong ⋅ Yicheng Liu ⋅ Tianyuan Yuan ⋅ Yue Wang ⋅ Yilun Wang ⋅ Hang Zhao

Spherical Transformer for LiDAR-Based 3D Recognition

Xin Lai ⋅ Yukang Chen ⋅ Fanbin Lu ⋅ Jianhui Liu ⋅ Jiaya Jia

Density-Insensitive Unsupervised Domain Adaption on 3D Object Detection

Qianjiang Hu ⋅ Daizong Liu ⋅ Wei Hu

PillarNeXt: Rethinking Network Designs for 3D Object Detection in LiDAR Point Clouds

Jinyu Li ⋅ Chenxu Luo ⋅ Xiaodong Yang

PeakConv: Learning Peak Receptive Field for Radar Semantic Segmentation

Liwen Zhang ⋅ Xinyan Zhang ⋅ Youcheng Zhang ⋅ Yufei Guo ⋅ Yuanpei Chen ⋅ Xuhui Huang ⋅ Zhe Ma

Single Domain Generalization for LiDAR Semantic Segmentation

Hyeonseong Kim ⋅ Yoonsu Kang ⋅ Changgyoon Oh ⋅ Kuk-Jin Yoon

Weakly Supervised Class-Agnostic Motion Prediction for Autonomous Driving

Ruibo Li ⋅ Hanyu Shi ⋅ Ziang Fu ⋅ Zhe Wang ⋅ Guosheng Lin

MethaneMapper: Spectral Absorption Aware Hyperspectral Transformer for Methane Detection

Satish Kumar ⋅ Ivan Arevalo ⋅ ASM Iftekhar ⋅ B S Manjunath

GrowSP: Unsupervised Semantic Segmentation of 3D Point Clouds

Zihui Zhang ⋅ Bo Yang ⋅ Bing Wang ⋅ Bo Li

SCoDA: Domain Adaptive Shape Completion for Real Scans

Yushuang Wu ⋅ Zizheng Yan ⋅ Ce Chen ⋅ Lai Wei ⋅ Xiao Li ⋅ Guanbin Li ⋅ Yihao Li ⋅ Shuguang Cui ⋅ Xiaoguang Han

SCPNet: Semantic Scene Completion on Point Cloud

Zhaoyang Xia ⋅ Youquan Liu ⋅ Xin Li ⋅ Xinge Zhu ⋅ Yuexin Ma ⋅ Yikang Li ⋅ Yuenan Hou ⋅ Yu Qiao

ViewNet: A Novel Projection-Based Backbone With View Pooling for Few-Shot Point Cloud Classification

Jiajing Chen ⋅ Minmin Yang ⋅ Senem Velipasalar

Complete-to-Partial 4D Distillation for Self-Supervised Point Cloud Sequence Representation Learning

Zhuoyang Zhang ⋅ Yuhao Dong ⋅ Yunze Liu ⋅ Li Yi

Learnable Skeleton-Aware 3D Point Cloud Sampling

Cheng Wen ⋅ Baosheng Yu ⋅ Dacheng Tao

Meta Architecture for Point Cloud Analysis

Haojia Lin ⋅ Xiawu Zheng ⋅ Lijiang Li ⋅ Fei Chao ⋅ Shanshan Wang ⋅ Yan Wang ⋅ Yonghong Tian ⋅ Rongrong Ji

PointListNet: Deep Learning on 3D Point Lists

Hehe Fan ⋅ Linchao Zhu ⋅ Yi Yang ⋅ Mohan Kankanhalli

PEAL: Prior-Embedded Explicit Attention Learning for Low-Overlap Point Cloud Registration

Junle Yu ⋅ Luwei Ren ⋅ Yu Zhang ⋅ Wenhui Zhou ⋅ Lili Lin ⋅ Guojun Dai

Unsupervised Inference of Signed Distance Functions From Single Sparse Point Clouds Without Learning Priors

Chao Chen ⋅ Yu-Shen Liu ⋅ Zhizhong Han

Towards Better Gradient Consistency for Neural Signed Distance Functions via Level Set Alignment

Baorui Ma ⋅ Junsheng Zhou ⋅ Yu-Shen Liu ⋅ Zhizhong Han

Self-Supervised Learning for Multimodal Non-Rigid 3D Shape Matching

Dongliang Cao ⋅ Florian Bernard

3D Registration With Maximal Cliques

Xiyu Zhang ⋅ Jiaqi Yang ⋅ Shikun Zhang ⋅ Yanning Zhang

PanoSwin: A Pano-Style Swin Transformer for Panorama Understanding

Zhixin Ling ⋅ Zhen Xing ⋅ Xiangdong Zhou ⋅ Manliang Cao ⋅ Guichun Zhou

DKM: Dense Kernelized Feature Matching for Geometry Estimation

Johan Edstedt ⋅ Ioannis Athanasiadis ⋅ Mårten Wadenbäck ⋅ Michael Felsberg

PATS: Patch Area Transportation With Subdivision for Local Feature Matching

Junjie Ni ⋅ Yijin Li ⋅ Zhaoyang Huang ⋅ Hongsheng Li ⋅ Hujun Bao ⋅ Zhaopeng Cui ⋅ Guofeng Zhang

Correspondence Transformers With Asymmetric Feature Learning and Matching Flow Super-Resolution

Yixuan Sun ⋅ Dongyang Zhao ⋅ Zhangyue Yin ⋅ Yiwen Huang ⋅ Tao Gui ⋅ Wenqiang Zhang ⋅ Weifeng Ge

Learning Adaptive Dense Event Stereo From the Image Domain

Hoonhee Cho ⋅ Jegyeong Cho ⋅ Kuk-Jin Yoon

On the Convergence of IRLS and Its Variants in Outlier-Robust Estimation

Liangzu Peng ⋅ Christian Kümmerle ⋅ René Vidal

You Only Segment Once: Towards Real-Time Panoptic Segmentation

Jie Hu ⋅ Linyan Huang ⋅ Tianhe Ren ⋅ Shengchuan Zhang ⋅ Rongrong Ji ⋅ Liujuan Cao

BEVFormer v2: Adapting Modern Image Backbones to Bird’s-Eye-View Recognition via Perspective Supervision

Chenyu Yang ⋅ Yuntao Chen ⋅ Hao Tian ⋅ Chenxin Tao ⋅ Xizhou Zhu ⋅ Zhaoxiang Zhang ⋅ Gao Huang ⋅ Hongyang Li ⋅ Yu Qiao ⋅ Lewei Lu ⋅ Jie Zhou ⋅ Jifeng Dai

UniHCP: A Unified Model for Human-Centric Perceptions

Yuanzheng Ci ⋅ Yizhou Wang ⋅ Meilin Chen ⋅ Shixiang Tang ⋅ Lei Bai ⋅ Feng Zhu ⋅ Rui Zhao ⋅ Fengwei Yu ⋅ Donglian Qi ⋅ Wanli Ouyang

Planning-Oriented Autonomous Driving

Yihan Hu ⋅ Jiazhi Yang ⋅ Li Chen ⋅ Keyu Li ⋅ Chonghao Sima ⋅ Xizhou Zhu ⋅ Siqi Chai ⋅ Senyao Du ⋅ Tianwei Lin ⋅ Wenhai Wang ⋅ Lewei Lu ⋅ Xiaosong Jia ⋅ Qiang Liu ⋅ Jifeng Dai ⋅ Yu Qiao ⋅ Hongyang Li

Query-Centric Trajectory Prediction

Zikang Zhou ⋅ Jianping Wang ⋅ Yung-Hui Li ⋅ Yu-Kai Huang

Unsupervised Sampling Promoting for Stochastic Human Trajectory Prediction

Guangyi Chen ⋅ Zhenhao Chen ⋅ Shunxing Fan ⋅ Kun Zhang

AdamsFormer for Spatial Action Localization in the Future

Hyung-gun Chi ⋅ Kwonjoon Lee ⋅ Nakul Agarwal ⋅ Yi Xu ⋅ Karthik Ramani ⋅ Chiho Choi

PIRLNav: Pretraining With Imitation and RL Finetuning for ObjectNav

Ram Ramrakhya ⋅ Dhruv Batra ⋅ Erik Wijmans ⋅ Abhishek Das

NeRF in the Palm of Your Hand: Corrective Augmentation for Robotics via Novel-View Synthesis

Allan Zhou ⋅ Moo Jin Kim ⋅ Lirui Wang ⋅ Pete Florence ⋅ Chelsea Finn

Camouflaged Instance Segmentation via Explicit De-Camouflaging

Naisong Luo ⋅ Yuwen Pan ⋅ Rui Sun ⋅ Tianzhu Zhang ⋅ Zhiwei Xiong ⋅ Feng Wu

Standing Between Past and Future: Spatio-Temporal Modeling for Multi-Camera 3D Multi-Object Tracking

Ziqi Pang ⋅ Jie Li ⋅ Pavel Tokmakov ⋅ Dian Chen ⋅ Sergey Zagoruyko ⋅ Yu-Xiong Wang

MotionTrack: Learning Robust Short-Term and Long-Term Motions for Multi-Object Tracking

Zheng Qin ⋅ Sanping Zhou ⋅ Le Wang ⋅ Jinghai Duan ⋅ Gang Hua ⋅ Wei Tang

Multi-Modal Gait Recognition via Effective Spatial-Temporal Feature Fusion

Yufeng Cui ⋅ Yimei Kang

Rethinking the Learning Paradigm for Dynamic Facial Expression Recognition

Hanyang Wang ⋅ Bo Li ⋅ Shuang Wu ⋅ Siyuan Shen ⋅ Feng Liu ⋅ Shouhong Ding ⋅ Aimin Zhou

One-Shot High-Fidelity Talking-Head Synthesis With Deformable Neural Radiance Field

Weichuang Li ⋅ Longhao Zhang ⋅ Dong Wang ⋅ Bin Zhao ⋅ Zhigang Wang ⋅ Mulin Chen ⋅ Bang Zhang ⋅ Zhongjian Wang ⋅ Liefeng Bo ⋅ Xuelong Li

Progressive Disentangled Representation Learning for Fine-Grained Controllable Talking Head Synthesis

Duomin Wang ⋅ Yu Deng ⋅ Zixin Yin ⋅ Heung-Yeung Shum ⋅ Baoyuan Wang

Event-Guided Person Re-Identification via Sparse-Dense Complementary Learning

Chengzhi Cao ⋅ Xueyang Fu ⋅ Hongjian Liu ⋅ Yukun Huang ⋅ Kunyu Wang ⋅ Jiebo Luo ⋅ Zheng-Jun Zha

Executing Your Commands via Motion Diffusion in Latent Space

Xin Chen ⋅ Biao Jiang ⋅ Wen Liu ⋅ Zilong Huang ⋅ Bin Fu ⋅ Tao Chen ⋅ Gang Yu

MoLo: Motion-Augmented Long-Short Contrastive Learning for Few-Shot Action Recognition

Xiang Wang ⋅ Shiwei Zhang ⋅ Zhiwu Qing ⋅ Changxin Gao ⋅ Yingya Zhang ⋅ Deli Zhao ⋅ Nong Sang

“Seeing” Electric Network Frequency From Events

Lexuan Xu ⋅ Guang Hua ⋅ Haijian Zhang ⋅ Lei Yu ⋅ Ning Qiao

Event-Based Video Frame Interpolation With Cross-Modal Asymmetric Bidirectional Motion Fields

Taewoo Kim ⋅ Yujeong Chae ⋅ Hyun-Kurl Jang ⋅ Kuk-Jin Yoon

Event-Based Frame Interpolation With Ad-Hoc Deblurring

Lei Sun ⋅ Christos Sakaridis ⋅ Jingyun Liang ⋅ Peng Sun ⋅ Jiezhang Cao ⋅ Kai Zhang ⋅ Qi Jiang ⋅ Kaiwei Wang ⋅ Luc Van Gool

Video Dehazing via a Multi-Range Temporal Alignment Network With Physical Prior

Jiaqi Xu ⋅ Xiaowei Hu ⋅ Lei Zhu ⋅ Qi Dou ⋅ Jifeng Dai ⋅ Yu Qiao ⋅ Pheng-Ann Heng

TransFlow: Transformer As Flow Learner

Yawen Lu ⋅ Qifan Wang ⋅ Siqi Ma ⋅ Tong Geng ⋅ Yingjie Victor Chen ⋅ Huaijin Chen ⋅ Dongfang Liu

MP-Former: Mask-Piloted Transformer for Image Segmentation

Hao Zhang ⋅ Feng Li ⋅ Huaizhe Xu ⋅ Shijia Huang ⋅ Shilong Liu ⋅ Lionel M. Ni ⋅ Lei Zhang

GradICON: Approximate Diffeomorphisms via Gradient Inverse Consistency

Lin Tian ⋅ Hastings Greer ⋅ François-Xavier Vialard ⋅ Roland Kwitt ⋅ Raúl San José Estépar ⋅ Richard Jarrett Rushmore ⋅ Nikolaos Makris ⋅ Sylvain Bouix ⋅ Marc Niethammer

Neural Texture Synthesis With Guided Correspondence

Yang Zhou ⋅ Kaijian Chen ⋅ Rongjun Xiao ⋅ Hui Huang

Self-Supervised Non-Uniform Kernel Estimation With Flow-Based Motion Prior for Blind Image Deblurring

Zhenxuan Fang ⋅ Fangfang Wu ⋅ Weisheng Dong ⋅ Xin Li ⋅ Jinjian Wu ⋅ Guangming Shi

Decoupling-and-Aggregating for Image Exposure Correction

Yang Wang ⋅ Long Peng ⋅ Liang Li ⋅ Yang Cao ⋅ Zheng-Jun Zha

You Do Not Need Additional Priors or Regularizers in Retinex-Based Low-Light Image Enhancement

Huiyuan Fu ⋅ Wenkai Zheng ⋅ Xiangyu Meng ⋅ Xin Wang ⋅ Chuanming Wang ⋅ Huadong Ma

DNF: Decouple and Feedback Network for Seeing in the Dark

Xin Jin ⋅ Ling-Hao Han ⋅ Zhen Li ⋅ Chun-Le Guo ⋅ Zhi Chai ⋅ Chongyi Li

Contrastive Semi-Supervised Learning for Underwater Image Restoration via Reliable Bank

Shirui Huang ⋅ Keyan Wang ⋅ Huan Liu ⋅ Jun Chen ⋅ Yunsong Li

LG-BPN: Local and Global Blind-Patch Network for Self-Supervised Real-World Denoising

Zichun Wang ⋅ Ying Fu ⋅ Ji Liu ⋅ Yulun Zhang

Spectral Bayesian Uncertainty for Image Super-Resolution

Tao Liu ⋅ Jun Cheng ⋅ Shan Tan

Deep Random Projector: Accelerated Deep Image Prior

Taihui Li ⋅ Hengkang Wang ⋅ Zhong Zhuang ⋅ Ju Sun

Context-Aware Pretraining for Efficient Blind Image Decomposition

Chao Wang ⋅ Zhedong Zheng ⋅ Ruijie Quan ⋅ Yifan Sun ⋅ Yi Yang

Metadata-Based RAW Reconstruction via Implicit Neural Functions

Leyi Li ⋅ Huijie Qiao ⋅ Qi Ye ⋅ Qinmin Yang

Raw Image Reconstruction With Learned Compact Metadata

Yufei Wang ⋅ Yi Yu ⋅ Wenhan Yang ⋅ Lanqing Guo ⋅ Lap-Pui Chau ⋅ Alex C. Kot ⋅ Bihan Wen

AccelIR: Task-Aware Image Compression for Accelerating Neural Restoration

Juncheol Ye ⋅ Hyunho Yeo ⋅ Jinwoo Park ⋅ Dongsu Han

AutoFocusFormer: Image Segmentation off the Grid

Chen Ziwen ⋅ Kaushik Patnaik ⋅ Shuangfei Zhai ⋅ Alvin Wan ⋅ Zhile Ren ⋅ Alexander G. Schwing ⋅ Alex Colburn ⋅ Li Fuxin

Guided Depth Super-Resolution by Deep Anisotropic Diffusion

Nando Metzger ⋅ Rodrigo Caye Daudt ⋅ Konrad Schindler

Super-Resolution Neural Operator

Min Wei ⋅ Xuesong Zhang

Cascaded Local Implicit Transformer for Arbitrary-Scale Super-Resolution

Hao-Wei Chen ⋅ Yu-Syuan Xu ⋅ Min-Fong Hong ⋅ Yi-Min Tsai ⋅ Hsien-Kai Kuo ⋅ Chun-Yi Lee

GamutMLP: A Lightweight MLP for Color Loss Recovery

Hoang M. Le ⋅ Brian Price ⋅ Scott Cohen ⋅ Michael S. Brown

Efficient and Explicit Modelling of Image Hierarchies for Image Restoration

Yawei Li ⋅ Yuchen Fan ⋅ Xiaoyu Xiang ⋅ Denis Demandolx ⋅ Rakesh Ranjan ⋅ Radu Timofte ⋅ Luc Van Gool

LEMaRT: Label-Efficient Masked Region Transform for Image Harmonization

Sheng Liu ⋅ Cong Phuoc Huynh ⋅ Cong Chen ⋅ Maxim Arap ⋅ Raffay Hamid

CAP-VSTNet: Content Affinity Preserved Versatile Style Transfer

Linfeng Wen ⋅ Chengying Gao ⋅ Changqing Zou

ObjectStitch: Object Compositing With Diffusion Model

Yizhi Song ⋅ Zhifei Zhang ⋅ Zhe Lin ⋅ Scott Cohen ⋅ Brian Price ⋅ Jianming Zhang ⋅ Soo Ye Kim ⋅ Daniel Aliaga

DeepVecFont-v2: Exploiting Transformers To Synthesize Vector Fonts With Higher Quality

Yuqing Wang ⋅ Yizhi Wang ⋅ Longhui Yu ⋅ Yuesheng Zhu ⋅ Zhouhui Lian

Master: Meta Style Transformer for Controllable Zero-Shot and Few-Shot Artistic Style Transfer

Hao Tang ⋅ Songhua Liu ⋅ Tianwei Lin ⋅ Shaoli Huang ⋅ Fu Li ⋅ Dongliang He ⋅ Xinchao Wang

CLIP-Sculptor: Zero-Shot Generation of High-Fidelity and Diverse Shapes From Natural Language

Aditya Sanghi ⋅ Rao Fu ⋅ Vivian Liu ⋅ Karl D.D. Willis ⋅ Hooman Shayani ⋅ Amir H. Khasahmadi ⋅ Srinath Sridhar ⋅ Daniel Ritchie

LayoutDM: Transformer-Based Diffusion Model for Layout Generation

Shang Chai ⋅ Liansheng Zhuang ⋅ Fengying Yan

Imagen Editor and EditBench: Advancing and Evaluating Text-Guided Image Inpainting

Su Wang ⋅ Chitwan Saharia ⋅ Ceslee Montgomery ⋅ Jordi Pont-Tuset ⋅ Shai Noy ⋅ Stefano Pellegrini ⋅ Yasumasa Onoe ⋅ Sarah Laszlo ⋅ David J. Fleet ⋅ Radu Soricut ⋅ Jason Baldridge ⋅ Mohammad Norouzi ⋅ Peter Anderson ⋅ William Chan

SpaText: Spatio-Textual Representation for Controllable Image Generation

Omri Avrahami ⋅ Thomas Hayes ⋅ Oran Gafni ⋅ Sonal Gupta ⋅ Yaniv Taigman ⋅ Devi Parikh ⋅ Dani Lischinski ⋅ Ohad Fried ⋅ Xi Yin

Paint by Example: Exemplar-Based Image Editing With Diffusion Models

Binxin Yang ⋅ Shuyang Gu ⋅ Bo Zhang ⋅ Ting Zhang ⋅ Xuejin Chen ⋅ Xiaoyan Sun ⋅ Dong Chen ⋅ Fang Wen

InstructPix2Pix: Learning To Follow Image Editing Instructions

Tim Brooks ⋅ Aleksander Holynski ⋅ Alexei A. Efros

LayoutFormer++: Conditional Graphic Layout Generation via Constraint Serialization and Decoding Space Restriction

Zhaoyun Jiang ⋅ Jiaqi Guo ⋅ Shizhao Sun ⋅ Huayu Deng ⋅ Zhongkai Wu ⋅ Vuksan Mijovic ⋅ Zijiang James Yang ⋅ Jian-Guang Lou ⋅ Dongmei Zhang

Self-Guided Diffusion Models

Vincent Tao Hu ⋅ David W. Zhang ⋅ Yuki M. Asano ⋅ Gertjan J. Burghouts ⋅ Cees G. M. Snoek

HOLODIFFUSION: Training a 3D Diffusion Model Using 2D Images

Animesh Karnewar ⋅ Andrea Vedaldi ⋅ David Novotny ⋅ Niloy J. Mitra

Class-Balancing Diffusion Models

Yiming Qin ⋅ Huangjie Zheng ⋅ Jiangchao Yao ⋅ Mingyuan Zhou ⋅ Ya Zhang

Conditional Image-to-Video Generation With Latent Flow Diffusion Models

Haomiao Ni ⋅ Changhao Shi ⋅ Kai Li ⋅ Sharon X. Huang ⋅ Martin Renqiang Min

Video Probabilistic Diffusion Models in Projected Latent Space

Sihyun Yu ⋅ Kihyuk Sohn ⋅ Subin Kim ⋅ Jinwoo Shin

Regularized Vector Quantization for Tokenized Image Synthesis

Jiahui Zhang ⋅ Fangneng Zhan ⋅ Christian Theobalt ⋅ Shijian Lu

EfficientSCI: Densely Connected Network With Space-Time Factorization for Large-Scale Video Snapshot Compressive Imaging

Lishun Wang ⋅ Miao Cao ⋅ Xin Yuan

MMVC: Learned Multi-Mode Video Compression With Block-Based Prediction Mode Selection and Density-Adaptive Entropy Coding

Bowen Liu ⋅ Yu Chen ⋅ Rakesh Chowdary Machineni ⋅ Shiyu Liu ⋅ Hun-Seok Kim

Video Compression With Entropy-Constrained Neural Representations

Carlos Gomes ⋅ Roberto Azevedo ⋅ Christopher Schroers

WIRE: Wavelet Implicit Neural Representations

Vishwanath Saragadam ⋅ Daniel LeJeune ⋅ Jasper Tan ⋅ Guha Balakrishnan ⋅ Ashok Veeraraghavan ⋅ Richard G. Baraniuk

TINC: Tree-Structured Implicit Neural Compression

Runzhao Yang

CompletionFormer: Depth Completion With Convolutions and Vision Transformers

Youmin Zhang ⋅ Xianda Guo ⋅ Matteo Poggi ⋅ Zheng Zhu ⋅ Guan Huang ⋅ Stefano Mattoccia

Lite-Mono: A Lightweight CNN and Transformer Architecture for Self-Supervised Monocular Depth Estimation

Ning Zhang ⋅ Francesco Nex ⋅ George Vosselman ⋅ Norman Kerle

Global Vision Transformer Pruning With Hessian-Aware Saliency

Huanrui Yang ⋅ Hongxu Yin ⋅ Maying Shen ⋅ Pavlo Molchanov ⋅ Hai Li ⋅ Jan Kautz

Lite DETR: An Interleaved Multi-Scale Encoder for Efficient DETR

Feng Li ⋅ Ailing Zeng ⋅ Shilong Liu ⋅ Hao Zhang ⋅ Hongyang Li ⋅ Lei Zhang ⋅ Lionel M. Ni

PaCa-ViT: Learning Patch-to-Cluster Attention in Vision Transformers

Ryan Grainger ⋅ Thomas Paniagua ⋅ Xi Song ⋅ Naresh Cuntoor ⋅ Mun Wai Lee ⋅ Tianfu Wu

Visual Atoms: Pre-Training Vision Transformers With Sinusoidal Waves

Sora Takashima ⋅ Ryo Hayamizu ⋅ Nakamasa Inoue ⋅ Hirokatsu Kataoka ⋅ Rio Yokota

Neuron Structure Modeling for Generalizable Remote Physiological Measurement

Hao Lu ⋅ Zitong Yu ⋅ Xuesong Niu ⋅ Ying-Cong Chen

Explaining Image Classifiers With Multiscale Directional Image Representation

Stefan Kolek ⋅ Robert Windesheim ⋅ Hector Andrade-Loarca ⋅ Gitta Kutyniok ⋅ Ron Levie

Integrally Pre-Trained Transformer Pyramid Networks

Yunjie Tian ⋅ Lingxi Xie ⋅ Zhaozhi Wang ⋅ Longhui Wei ⋅ Xiaopeng Zhang ⋅ Jianbin Jiao ⋅ Yaowei Wang ⋅ Qi Tian ⋅ Qixiang Ye

PartMix: Regularization Strategy To Learn Part Discovery for Visible-Infrared Person Re-Identification

Minsu Kim ⋅ Seungryong Kim ⋅ Jungin Park ⋅ Seongheon Park ⋅ Kwanghoon Sohn

Knowledge Distillation for 6D Pose Estimation by Aligning Distributions of Local Predictions

Shuxuan Guo ⋅ Yinlin Hu ⋅ Jose M. Alvarez ⋅ Mathieu Salzmann

Focused and Collaborative Feedback Integration for Interactive Image Segmentation

Qiaoqiao Wei ⋅ Hui Zhang ⋅ Jun-Hai Yong

PolyFormer: Referring Image Segmentation As Sequential Polygon Generation

Jiang Liu ⋅ Hui Ding ⋅ Zhaowei Cai ⋅ Yuting Zhang ⋅ Ravi Kumar Satzoda ⋅ Vijay Mahadevan ⋅ R. Manmatha

Devil’s on the Edges: Selective Quad Attention for Scene Graph Generation

Deunsol Jung ⋅ Sanghyun Kim ⋅ Won Hwa Kim ⋅ Minsu Cho

Panoptic Video Scene Graph Generation

Jingkang Yang ⋅ Wenxuan Peng ⋅ Xiangtai Li ⋅ Zujin Guo ⋅ Liangyu Chen ⋅ Bo Li ⋅ Zheng Ma ⋅ Kaiyang Zhou ⋅ Wayne Zhang ⋅ Chen Change Loy ⋅ Ziwei Liu

Generalized Relation Modeling for Transformer Tracking

Shenyuan Gao ⋅ Chunluan Zhou ⋅ Jun Zhang

Representation Learning for Visual Object Tracking by Masked Appearance Transfer

Haojie Zhao ⋅ Dong Wang ⋅ Huchuan Lu

Unified Mask Embedding and Correspondence Learning for Self-Supervised Video Segmentation

Liulei Li ⋅ Wenguan Wang ⋅ Tianfei Zhou ⋅ Jianwu Li ⋅ Yi Yang

EVAL: Explainable Video Anomaly Localization

Ashish Singh ⋅ Michael J. Jones ⋅ Erik G. Learned-Miller

MOSO: Decomposing MOtion, Scene and Object for Video Prediction

Mingzhen Sun ⋅ Weining Wang ⋅ Xinxin Zhu ⋅ Jing Liu

TarViS: A Unified Approach for Target-Based Video Segmentation

Ali Athar ⋅ Alexander Hermans ⋅ Jonathon Luiten ⋅ Deva Ramanan ⋅ Bastian Leibe

Efficient Movie Scene Detection Using State-Space Transformers

Md Mohaiminul Islam ⋅ Mahmudul Hasan ⋅ Kishan Shamsundar Athrey ⋅ Tony Braskich ⋅ Gedas Bertasius

Latency Matters: Real-Time Action Forecasting Transformer

Harshayu Girase ⋅ Nakul Agarwal ⋅ Chiho Choi ⋅ Karttikeya Mangalam

Temporal Attention Unit: Towards Efficient Spatiotemporal Predictive Learning

Cheng Tan ⋅ Zhangyang Gao ⋅ Lirong Wu ⋅ Yongjie Xu ⋅ Jun Xia ⋅ Siyuan Li ⋅ Stan Z. Li

Watch or Listen: Robust Audio-Visual Speech Recognition With Visual Corruption Modeling and Reliability Scoring

Joanna Hong ⋅ Minsu Kim ⋅ Jeongsoo Choi ⋅ Yong Man Ro

ReVISE: Self-Supervised Speech Resynthesis With Visual Input for Universal and Generalized Speech Regeneration

Wei-Ning Hsu ⋅ Tal Remez ⋅ Bowen Shi ⋅ Jacob Donley ⋅ Yossi Adi

SynthVSR: Scaling Up Visual Speech Recognition With Synthetic Supervision

Xubo Liu ⋅ Egor Lakomkin ⋅ Konstantinos Vougioukas ⋅ Pingchuan Ma ⋅ Honglie Chen ⋅ Ruiming Xie ⋅ Morrie Doulaty ⋅ Niko Moritz ⋅ Jachym Kolar ⋅ Stavros Petridis ⋅ Maja Pantic ⋅ Christian Fuegen

SVFormer: Semi-Supervised Video Transformer for Action Recognition

Zhen Xing ⋅ Qi Dai ⋅ Han Hu ⋅ Jingjing Chen ⋅ Zuxuan Wu ⋅ Yu-Gang Jiang

Collecting Cross-Modal Presence-Absence Evidence for Weakly-Supervised Audio-Visual Event Perception

Junyu Gao ⋅ Mengyuan Chen ⋅ Changsheng Xu

Post-Processing Temporal Action Detection

Sauradip Nag ⋅ Xiatian Zhu ⋅ Yi-Zhe Song ⋅ Tao Xiang

HaLP: Hallucinating Latent Positives for Skeleton-Based Self-Supervised Learning of Actions

Anshul Shah ⋅ Aniket Roy ⋅ Ketul Shah ⋅ Shlok Mishra ⋅ David Jacobs ⋅ Anoop Cherian ⋅ Rama Chellappa

TriDet: Temporal Action Detection With Relative Boundary Modeling

Dingfeng Shi ⋅ Yujie Zhong ⋅ Qiong Cao ⋅ Lin Ma ⋅ Jia Li ⋅ Dacheng Tao

Hybrid Active Learning via Deep Clustering for Video Action Detection

Aayush J. Rana ⋅ Yogesh S. Rawat

Two-Stream Networks for Weakly-Supervised Temporal Action Localization With Semantic-Aware Mechanisms

Yu Wang ⋅ Yadong Li ⋅ Hongbin Wang

Weakly Supervised Video Emotion Detection and Prediction via Cross-Modal Temporal Erasing Network

Zhicheng Zhang ⋅ Lijuan Wang ⋅ Jufeng Yang

Collaborative Noisy Label Cleaner: Learning Scene-Aware Trailers for Multi-Modal Highlight Detection in Movies

Bei Gan ⋅ Xiujun Shu ⋅ Ruizhi Qiao ⋅ Haoqian Wu ⋅ Keyu Chen ⋅ Hanjun Li ⋅ Bo Ren

Weakly Supervised Temporal Sentence Grounding With Uncertainty-Guided Self-Training

Yifei Huang ⋅ Lijin Yang ⋅ Yoichi Sato

SViTT: Temporal Learning of Sparse Video-Text Transformers

Yi Li ⋅ Kyle Min ⋅ Subarna Tripathi ⋅ Nuno Vasconcelos

AutoAD: Movie Description in Context

Tengda Han ⋅ Max Bain ⋅ Arsha Nagrani ⋅ Gül Varol ⋅ Weidi Xie ⋅ Andrew Zisserman

Text With Knowledge Graph Augmented Transformer for Video Captioning

Xin Gu ⋅ Guang Chen ⋅ Yufei Wang ⋅ Libo Zhang ⋅ Tiejian Luo ⋅ Longyin Wen

StepFormer: Self-Supervised Step Discovery and Localization in Instructional Videos

Nikita Dvornik ⋅ Isma Hadji ⋅ Ran Zhang ⋅ Kosta Derpanis ⋅ Richard P. Wildes ⋅ Allan D. Jepson

Dual Alignment Unsupervised Domain Adaptation for Video-Text Retrieval

Xiaoshuai Hao ⋅ Wanqian Zhang ⋅ Dayan Wu ⋅ Fei Zhu ⋅ Bo Li

Hierarchical Semantic Correspondence Networks for Video Paragraph Grounding

Chaolei Tan ⋅ Zihang Lin ⋅ Jian-Fang Hu ⋅ Wei-Shi Zheng ⋅ Jianhuang Lai

CLIPPING: Distilling CLIP-Based Models With a Student Base for Video-Language Retrieval

Renjing Pei ⋅ Jianzhuang Liu ⋅ Weimian Li ⋅ Bin Shao ⋅ Songcen Xu ⋅ Peng Dai ⋅ Juwei Lu ⋅ Youliang Yan

Learning Emotion Representations From Verbal and Nonverbal Communication

Sitao Zhang ⋅ Yimu Pan ⋅ James Z. Wang

Context De-Confounded Emotion Recognition

Dingkang Yang ⋅ Zhaoyu Chen ⋅ Yuzheng Wang ⋅ Shunli Wang ⋅ Mingcheng Li ⋅ Siao Liu ⋅ Xiao Zhao ⋅ Shuai Huang ⋅ Zhiyan Dong ⋅ Peng Zhai ⋅ Lihua Zhang

CiCo: Domain-Aware Sign Language Retrieval via Cross-Lingual Contrastive Learning

Yiting Cheng ⋅ Fangyun Wei ⋅ Jianmin Bao ⋅ Dong Chen ⋅ Wenqiang Zhang

Discovering the Real Association: Multimodal Causal Reasoning in Video Question Answering

Chuanqi Zang ⋅ Hanqing Wang ⋅ Mingtao Pei ⋅ Wei Liang

LEGO-Net: Learning Regular Rearrangements of Objects in Rooms

Qiuhong Anna Wei ⋅ Sijie Ding ⋅ Jeong Joon Park ⋅ Rahul Sajnani ⋅ Adrien Poulenard ⋅ Srinath Sridhar ⋅ Leonidas Guibas

LANA: A Language-Capable Navigator for Instruction Following and Generation

Xiaohan Wang ⋅ Wenguan Wang ⋅ Jiayi Shao ⋅ Yi Yang

Policy Adaptation From Foundation Model Feedback

Yuying Ge ⋅ Annabella Macaluso ⋅ Li Erran Li ⋅ Ping Luo ⋅ Xiaolong Wang

Token Turing Machines

Michael S. Ryoo ⋅ Keerthana Gopalakrishnan ⋅ Kumara Kahatapitiya ⋅ Ted Xiao ⋅ Kanishka Rao ⋅ Austin Stone ⋅ Yao Lu ⋅ Julian Ibarz ⋅ Anurag Arnab

Unicode Analogies: An Anti-Objectivist Visual Reasoning Challenge

Steven Spratley ⋅ Krista A. Ehinger ⋅ Tim Miller

Exploring the Effect of Primitives for Compositional Generalization in Vision-and-Language

Chuanhao Li ⋅ Zhen Li ⋅ Chenchen Jing ⋅ Yunde Jia ⋅ Yuwei Wu

VQACL: A Novel Visual Question Answering Continual Learning Setting

Xi Zhang ⋅ Feifei Zhang ⋅ Changsheng Xu

MaPLe: Multi-Modal Prompt Learning

Muhammad Uzair Khattak ⋅ Hanoona Rasheed ⋅ Muhammad Maaz ⋅ Salman Khan ⋅ Fahad Shahbaz Khan

Meta-Personalizing Vision-Language Models To Find Named Instances in Video

Chun-Hsiao Yeh ⋅ Bryan Russell ⋅ Josef Sivic ⋅ Fabian Caba Heilbron ⋅ Simon Jenni

Understanding and Improving Visual Prompting: A Label-Mapping Perspective

Aochuan Chen ⋅ Yuguang Yao ⋅ Pin-Yu Chen ⋅ Yihua Zhang ⋅ Sijia Liu

RefTeacher: A Strong Baseline for Semi-Supervised Referring Expression Comprehension

Jiamu Sun ⋅ Gen Luo ⋅ Yiyi Zhou ⋅ Xiaoshuai Sun ⋅ Guannan Jiang ⋅ Zhiyu Wang ⋅ Rongrong Ji

Leveraging per Image-Token Consistency for Vision-Language Pre-Training

Yunhao Gou ⋅ Tom Ko ⋅ Hansi Yang ⋅ James Kwok ⋅ Yu Zhang ⋅ Mingxuan Wang

Improving Visual Grounding by Encouraging Consistent Gradient-Based Explanations

Ziyan Yang ⋅ Kushal Kafle ⋅ Franck Dernoncourt ⋅ Vicente Ordonez

Image as a Foreign Language: BEiT Pretraining for Vision and Vision-Language Tasks

Wenhui Wang ⋅ Hangbo Bao ⋅ Li Dong ⋅ Johan Bjorck ⋅ Zhiliang Peng ⋅ Qiang Liu ⋅ Kriti Aggarwal ⋅ Owais Khan Mohammed ⋅ Saksham Singhal ⋅ Subhojit Som ⋅ Furu Wei

Language in a Bottle: Language Model Guided Concept Bottlenecks for Interpretable Image Classification

Yue Yang ⋅ Artemis Panagopoulou ⋅ Shenghao Zhou ⋅ Daniel Jin ⋅ Chris Callison-Burch ⋅ Mark Yatskar

Shepherding Slots to Objects: Towards Stable and Robust Object-Centric Learning

Jinwoo Kim ⋅ Janghyuk Choi ⋅ Ho-Jin Choi ⋅ Seon Joo Kim

Learning Visual Representations via Language-Guided Sampling

Mohamed El Banani ⋅ Karan Desai ⋅ Justin Johnson

L-CoIns: Language-Based Colorization With Instance Awareness

Zheng Chang ⋅ Shuchen Weng ⋅ Peixuan Zhang ⋅ Yu Li ⋅ Si Li ⋅ Boxin Shi

EDA: Explicit Text-Decoupling and Dense Alignment for 3D Visual Grounding

Yanmin Wu ⋅ Xinhua Cheng ⋅ Renrui Zhang ⋅ Zesen Cheng ⋅ Jian Zhang

MSINet: Twins Contrastive Search of Multi-Scale Interaction for Object ReID

Jianyang Gu ⋅ Kai Wang ⋅ Hao Luo ⋅ Chen Chen ⋅ Wei Jiang ⋅ Yuqiang Fang ⋅ Shanghang Zhang ⋅ Yang You ⋅ Jian Zhao

Unifying Vision, Text, and Layout for Universal Document Processing

Zineng Tang ⋅ Ziyi Yang ⋅ Guoxin Wang ⋅ Yuwei Fang ⋅ Yang Liu ⋅ Chenguang Zhu ⋅ Michael Zeng ⋅ Cha Zhang ⋅ Mohit Bansal

RA-CLIP: Retrieval Augmented Contrastive Language-Image Pre-Training

Chen-Wei Xie ⋅ Siyang Sun ⋅ Xiong Xiong ⋅ Yun Zheng ⋅ Deli Zhao ⋅ Jingren Zhou

Fine-Grained Image-Text Matching by Cross-Modal Hard Aligning Network

Zhengxin Pan ⋅ Fangyu Wu ⋅ Bailing Zhang

Text-Guided Unsupervised Latent Transformation for Multi-Attribute Image Manipulation

Xiwen Wei ⋅ Zhen Xu ⋅ Cheng Liu ⋅ Si Wu ⋅ Zhiwen Yu ⋅ Hau San Wong

Improving Image Recognition by Retrieving From Web-Scale Image-Text Data

Ahmet Iscen ⋅ Alireza Fathi ⋅ Cordelia Schmid

Pic2Word: Mapping Pictures to Words for Zero-Shot Composed Image Retrieval

Kuniaki Saito ⋅ Kihyuk Sohn ⋅ Xiang Zhang ⋅ Chun-Liang Li ⋅ Chen-Yu Lee ⋅ Kate Saenko ⋅ Tomas Pfister

DATE: Domain Adaptive Product Seeker for E-Commerce

Haoyuan Li ⋅ Hao Jiang ⋅ Tao Jin ⋅ Mengyan Li ⋅ Yan Chen ⋅ Zhijie Lin ⋅ Yang Zhao ⋅ Zhou Zhao

Multimodality Helps Unimodality: Cross-Modal Few-Shot Learning With Multimodal Models

Zhiqiu Lin ⋅ Samuel Yu ⋅ Zhiyi Kuang ⋅ Deepak Pathak ⋅ Deva Ramanan

Finetune Like You Pretrain: Improved Finetuning of Zero-Shot Vision Models

Sachin Goyal ⋅ Ananya Kumar ⋅ Sankalp Garg ⋅ Zico Kolter ⋅ Aditi Raghunathan

DeepSolo: Let Transformer Decoder With Explicit Points Solo for Text Spotting

Maoyuan Ye ⋅ Jing Zhang ⋅ Shanshan Zhao ⋅ Juhua Liu ⋅ Tongliang Liu ⋅ Bo Du ⋅ Dacheng Tao

EVA: Exploring the Limits of Masked Visual Representation Learning at Scale

Yuxin Fang ⋅ Wen Wang ⋅ Binhui Xie ⋅ Quan Sun ⋅ Ledell Wu ⋅ Xinggang Wang ⋅ Tiejun Huang ⋅ Xinlong Wang ⋅ Yue Cao

R2Former: Unified Retrieval and Reranking Transformer for Place Recognition

Sijie Zhu ⋅ Linjie Yang ⋅ Chen Chen ⋅ Mubarak Shah ⋅ Xiaohui Shen ⋅ Heng Wang

Open-Set Fine-Grained Retrieval via Prompting Vision-Language Evaluator

Shijie Wang ⋅ Jianlong Chang ⋅ Haojie Li ⋅ Zhihui Wang ⋅ Wanli Ouyang ⋅ Qi Tian

Open-Category Human-Object Interaction Pre-Training via Language Modeling Framework

Sipeng Zheng ⋅ Boshen Xu ⋅ Qin Jin

Neural Congealing: Aligning Images to a Joint Semantic Atlas

Dolev Ofri-Amar ⋅ Michal Geyer ⋅ Yoni Kasten ⋅ Tali Dekel

Open Vocabulary Semantic Segmentation With Patch Aligned Contrastive Learning

Jishnu Mukhoti ⋅ Tsung-Yu Lin ⋅ Omid Poursaeed ⋅ Rui Wang ⋅ Ashish Shah ⋅ Philip H.S. Torr ⋅ Ser-Nam Lim

Semantic Human Parsing via Scalable Semantic Transfer Over Multiple Label Domains

Jie Yang ⋅ Chaoqun Wang ⋅ Zhen Li ⋅ Junle Wang ⋅ Ruimao Zhang

Explicit Visual Prompting for Low-Level Structure Segmentations

Weihuang Liu ⋅ Xi Shen ⋅ Chi-Man Pun ⋅ Xiaodong Cun

FreeSeg: Unified, Universal and Open-Vocabulary Image Segmentation

Jie Qin ⋅ Jie Wu ⋅ Pengxiang Yan ⋅ Ming Li ⋅ Ren Yuxi ⋅ Xuefeng Xiao ⋅ Yitong Wang ⋅ Rui Wang ⋅ Shilei Wen ⋅ Xin Pan ⋅ Xingang Wang

Zero-Shot Referring Image Segmentation With Global-Local Context Features

Seonghoon Yu ⋅ Paul Hongsuck Seo ⋅ Jeany Son

DejaVu: Conditional Regenerative Learning To Enhance Dense Prediction

Shubhankar Borse ⋅ Debasmit Das ⋅ Hyojin Park ⋅ Hong Cai ⋅ Risheek Garrepalli ⋅ Fatih Porikli

Meta Compositional Referring Expression Segmentation

Li Xu ⋅ Mark He Huang ⋅ Xindi Shang ⋅ Zehuan Yuan ⋅ Ying Sun ⋅ Jun Liu

Interactive Segmentation As Gaussion Process Classification

Minghao Zhou ⋅ Hong Wang ⋅ Qian Zhao ⋅ Yuexiang Li ⋅ Yawen Huang ⋅ Deyu Meng ⋅ Yefeng Zheng

Semantic-Promoted Debiasing and Background Disambiguation for Zero-Shot Instance Segmentation

Shuting He ⋅ Henghui Ding ⋅ Wei Jiang

Principles of Forgetting in Domain-Incremental Semantic Segmentation in Adverse Weather Conditions

Tobias Kalb ⋅ Jürgen Beyerer

AttentionShift: Iteratively Estimated Part-Based Attention Map for Pointly Supervised Instance Segmentation

Mingxiang Liao ⋅ Zonghao Guo ⋅ Yuze Wang ⋅ Peng Yuan ⋅ Bailan Feng ⋅ Fang Wan

PIDNet: A Real-Time Semantic Segmentation Network Inspired by PID Controllers

Jiacong Xu ⋅ Zixiang Xiong ⋅ Shankar P. Bhattacharyya

Leveraging Hidden Positives for Unsupervised Semantic Segmentation

Hyun Seok Seong ⋅ WonJun Moon ⋅ SuBeen Lee ⋅ Jae-Pil Heo

Understanding Imbalanced Semantic Segmentation Through Neural Collapse

Zhisheng Zhong ⋅ Jiequan Cui ⋅ Yibo Yang ⋅ Xiaoyang Wu ⋅ Xiaojuan Qi ⋅ Xiangyu Zhang ⋅ Jiaya Jia

Balancing Logit Variation for Long-Tailed Semantic Segmentation

Yuchao Wang ⋅ Jingjing Fei ⋅ Haochen Wang ⋅ Wei Li ⋅ Tianpeng Bao ⋅ Liwei Wu ⋅ Rui Zhao ⋅ Yujun Shen

Boundary-Enhanced Co-Training for Weakly Supervised Semantic Segmentation

Shenghai Rong ⋅ Bohai Tu ⋅ Zilei Wang ⋅ Junjie Li

Conflict-Based Cross-View Consistency for Semi-Supervised Semantic Segmentation

Zicheng Wang ⋅ Zhen Zhao ⋅ Xiaoxia Xing ⋅ Dong Xu ⋅ Xiangyu Kong ⋅ Luping Zhou

Learning Multi-Modal Class-Specific Tokens for Weakly Supervised Dense Object Localization

Lian Xu ⋅ Wanli Ouyang ⋅ Mohammed Bennamoun ⋅ Farid Boussaid ⋅ Dan Xu

WinCLIP: Zero-/Few-Shot Anomaly Classification and Segmentation

Jongheon Jeong ⋅ Yang Zou ⋅ Taewan Kim ⋅ Dongqing Zhang ⋅ Avinash Ravichandran ⋅ Onkar Dabeer

DualRel: Semi-Supervised Mitochondria Segmentation From a Prototype Perspective

Huayu Mai ⋅ Rui Sun ⋅ Tianzhu Zhang ⋅ Zhiwei Xiong ⋅ Feng Wu

Distilling Self-Supervised Vision Transformers for Weakly-Supervised Few-Shot Classification & Segmentation

Dahyun Kang ⋅ Piotr Koniusz ⋅ Minsu Cho ⋅ Naila Murray

Co-Salient Object Detection With Uncertainty-Aware Group Exchange-Masking

Yang Wu ⋅ Huihui Song ⋅ Bo Liu ⋅ Kaihua Zhang ⋅ Dong Liu

Supervised Masked Knowledge Distillation for Few-Shot Transformers

Han Lin ⋅ Guangxing Han ⋅ Jiawei Ma ⋅ Shiyuan Huang ⋅ Xudong Lin ⋅ Shih-Fu Chang

Modeling the Distributional Uncertainty for Salient Object Detection Models

Xinyu Tian ⋅ Jing Zhang ⋅ Mochu Xiang ⋅ Yuchao Dai

Weak-Shot Object Detection Through Mutual Knowledge Transfer

Xuanyi Du ⋅ Weitao Wan ⋅ Chong Sun ⋅ Chen Li

CAT: LoCalization and IdentificAtion Cascade Detection Transformer for Open-World Object Detection

Shuailei Ma ⋅ Yuefeng Wang ⋅ Ying Wei ⋅ Jiaqi Fan ⋅ Thomas H. Li ⋅ Hongli Liu ⋅ Fanbing Lv

Adaptive Sparse Pairwise Loss for Object Re-Identification

Xiao Zhou ⋅ Yujie Zhong ⋅ Zhen Cheng ⋅ Fan Liang ⋅ Lin Ma

DETRs With Hybrid Matching

Ding Jia ⋅ Yuhui Yuan ⋅ Haodi He ⋅ Xiaopei Wu ⋅ Haojun Yu ⋅ Weihong Lin ⋅ Lei Sun ⋅ Chao Zhang ⋅ Han Hu

Generating Features With Increased Crop-Related Diversity for Few-Shot Object Detection

Jingyi Xu ⋅ Hieu Le ⋅ Dimitris Samaras

ScaleKD: Distilling Scale-Aware Knowledge in Small Object Detector

Yichen Zhu ⋅ Qiqi Zhou ⋅ Ning Liu ⋅ Zhiyuan Xu ⋅ Zhicai Ou ⋅ Xiaofeng Mou ⋅ Jian Tang

Multiclass Confidence and Localization Calibration for Object Detection

Bimsara Pathiraja ⋅ Malitha Gunawardhana ⋅ Muhammad Haris Khan

Open-Set Representation Learning Through Combinatorial Embedding

Geeho Kim ⋅ Junoh Kang ⋅ Bohyung Han

ProD: Prompting-To-Disentangle Domain Knowledge for Cross-Domain Few-Shot Image Classification

Tianyi Ma ⋅ Yifan Sun ⋅ Zongxin Yang ⋅ Yi Yang

Visual Language Pretrained Multiple Instance Zero-Shot Transfer for Histopathology Images

Ming Y. Lu ⋅ Bowen Chen ⋅ Andrew Zhang ⋅ Drew F. K. Williamson ⋅ Richard J. Chen ⋅ Tong Ding ⋅ Long Phi Le ⋅ Yung-Sung Chuang ⋅ Faisal Mahmood

FFF: Fragment-Guided Flexible Fitting for Building Complete Protein Structures

Weijie Chen ⋅ Xinyan Wang ⋅ Yuhang Wang

Pseudo-Label Guided Contrastive Learning for Semi-Supervised Medical Image Segmentation

Hritam Basak ⋅ Zhaozheng Yin

Hierarchical Discriminative Learning Improves Visual Representations of Biomedical Microscopy

Cheng Jiang ⋅ Xinhai Hou ⋅ Akhil Kondepudi ⋅ Asadur Chowdury ⋅ Christian W. Freudiger ⋅ Daniel A. Orringer ⋅ Honglak Lee ⋅ Todd C. Hollon

KiUT: Knowledge-Injected U-Transformer for Radiology Report Generation

Zhongzhen Huang ⋅ Xiaofan Zhang ⋅ Shaoting Zhang

Image Quality-Aware Diagnosis via Meta-Knowledge Co-Embedding

Haoxuan Che ⋅ Siyu Chen ⋅ Hao Chen

Interventional Bag Multi-Instance Learning on Whole-Slide Pathological Images

Tiancheng Lin ⋅ Zhimiao Yu ⋅ Hongyu Hu ⋅ Yi Xu ⋅ Chang-Wen Chen

Visual Prompt Tuning for Generative Transfer Learning

Kihyuk Sohn ⋅ Huiwen Chang ⋅ José Lezama ⋅ Luisa Polania ⋅ Han Zhang ⋅ Yuan Hao ⋅ Irfan Essa ⋅ Lu Jiang

LINe: Out-of-Distribution Detection by Leveraging Important Neurons

Yong Hyun Ahn ⋅ Gyeong-Moon Park ⋅ Seong Tae Kim

GCFAgg: Global and Cross-View Feature Aggregation for Multi-View Clustering

Weiqing Yan ⋅ Yuanyang Zhang ⋅ Chenlei Lv ⋅ Chang Tang ⋅ Guanghui Yue ⋅ Liang Liao ⋅ Weisi Lin

Exploring and Exploiting Uncertainty for Incomplete Multi-View Classification

Mengyao Xie ⋅ Zongbo Han ⋅ Changqing Zhang ⋅ Yichen Bai ⋅ Qinghua Hu

BiCro: Noisy Correspondence Rectification for Multi-Modality Data via Bi-Directional Cross-Modal Similarity Consistency

Shuo Yang ⋅ Zhaopan Xu ⋅ Kai Wang ⋅ Yang You ⋅ Hongxun Yao ⋅ Tongliang Liu ⋅ Min Xu

Bi-Directional Distribution Alignment for Transductive Zero-Shot Learning

Zhicai Wang ⋅ Yanbin Hao ⋅ Tingting Mu ⋅ Ouxiang Li ⋅ Shuo Wang ⋅ Xiangnan He

HIER: Metric Learning Beyond Class Labels via Hierarchical Regularization

Sungyeon Kim ⋅ Boseung Jeong ⋅ Suha Kwak

MaskCon: Masked Contrastive Learning for Coarse-Labelled Dataset

Chen Feng ⋅ Ioannis Patras

Class Prototypes Based Contrastive Learning for Classifying Multi-Label and Fine-Grained Educational Videos

Rohit Gupta ⋅ Anirban Roy ⋅ Claire Christensen ⋅ Sujeong Kim ⋅ Sarah Gerard ⋅ Madeline Cincebeaux ⋅ Ajay Divakaran ⋅ Todd Grindal ⋅ Mubarak Shah

Learning From Noisy Labels With Decoupled Meta Label Purifier

Yuanpeng Tu ⋅ Boshen Zhang ⋅ Yuxi Li ⋅ Liang Liu ⋅ Jian Li ⋅ Yabiao Wang ⋅ Chengjie Wang ⋅ Cai Rong Zhao

SuperDisco: Super-Class Discovery Improves Visual Recognition for the Long-Tail

Yingjun Du ⋅ Jiayi Shen ⋅ Xiantong Zhen ⋅ Cees G. M. Snoek

Why Is the Winner the Best?

Matthias Eisenmann ⋅ Annika Reinke ⋅ Vivienn Weru ⋅ Minu D. Tizabi ⋅ Fabian Isensee ⋅ Tim J. Adler ⋅ Sharib Ali ⋅ Vincent Andrearczyk ⋅ Marc Aubreville ⋅ Ujjwal Baid ⋅ Spyridon Bakas ⋅ Niranjan Balu ⋅ Sophia Bano ⋅ Jorge Bernal ⋅ Sebastian Bodenstedt ⋅ Alessandro Casella ⋅ Veronika Cheplygina ⋅ Marie Daum ⋅ Marleen de Bruijne ⋅ Adrien Depeursinge ⋅ Reuben Dorent ⋅ Jan Egger ⋅ David G. Ellis ⋅ Sandy Engelhardt ⋅ Melanie Ganz ⋅ Noha Ghatwary ⋅ Gabriel Girard ⋅ Patrick Godau ⋅ Anubha Gupta ⋅ Lasse Hansen ⋅ Kanako Harada ⋅ Mattias P. Heinrich ⋅ Nicholas Heller ⋅ Alessa Hering ⋅ Arnaud Huaulmé ⋅ Pierre Jannin ⋅ Ali Emre Kavur ⋅ Oldřich Kodym ⋅ Michal Kozubek ⋅ Jianning Li ⋅ Hongwei Li ⋅ Jun Ma ⋅ Carlos Martín-Isla ⋅ Bjoern Menze ⋅ Alison Noble ⋅ Valentin Oreiller ⋅ Nicolas Padoy ⋅ Sarthak Pati ⋅ Kelly Payette ⋅ Tim Rädsch ⋅ Jonathan Rafael-Patiño ⋅ Vivek Singh Bawa ⋅ Stefanie Speidel ⋅ Carole H. Sudre ⋅ Kimberlin van Wijnen ⋅ Martin Wagner ⋅ Donglai Wei ⋅ Amine Yamlahi ⋅ Moi Hoon Yap ⋅ Chun Yuan ⋅ Maximilian Zenk ⋅ Aneeq Zia ⋅ David Zimmerer ⋅ Dogu Baran Aydogan ⋅ Binod Bhattarai ⋅ Louise Bloch ⋅ Raphael Brüngel ⋅ Jihoon Cho ⋅ Chanyeol Choi ⋅ Qi Dou ⋅ Ivan Ezhov ⋅ Christoph M. Friedrich ⋅ Clifton D. Fuller ⋅ Rebati Raman Gaire ⋅ Adrian Galdran ⋅ Álvaro García Faura ⋅ Maria Grammatikopoulou ⋅ SeulGi Hong ⋅ Mostafa Jahanifar ⋅ Ikbeom Jang ⋅ Abdolrahim Kadkhodamohammadi ⋅ Inha Kang ⋅ Florian Kofler ⋅ Satoshi Kondo ⋅ Hugo Kuijf ⋅ Mingxing Li ⋅ Minh Luu ⋅ Tomaž Martinčič ⋅ Pedro Morais ⋅ Mohamed A. Naser ⋅ Bruno Oliveira ⋅ David Owen ⋅ Subeen Pang ⋅ Jinah Park ⋅ Sung-Hong Park ⋅ Szymon Plotka ⋅ Elodie Puybareau ⋅ Nasir Rajpoot ⋅ Kanghyun Ryu ⋅ Numan Saeed ⋅ Adam Shephard ⋅ Pengcheng Shi ⋅ Dejan Štepec ⋅ Ronast Subedi ⋅ Guillaume Tochon ⋅ Helena R. Torres ⋅ Helene Urien ⋅ João L. Vilaça ⋅ Kareem A. Wahid ⋅ Haojie Wang ⋅ Jiacheng Wang ⋅ Liansheng Wang ⋅ Xiyue Wang ⋅ Benedikt Wiestler ⋅ Marek Wodzinski ⋅ Fangfang Xia ⋅ Juanying Xie ⋅ Zhiwei Xiong ⋅ Sen Yang ⋅ Yanwu Yang ⋅ Zixuan Zhao ⋅ Klaus Maier-Hein ⋅ Paul F. Jäger ⋅ Annette Kopp-Schneider ⋅ Lena Maier-Hein

Balanced Product of Calibrated Experts for Long-Tailed Recognition

Emanuel Sanchez Aimar ⋅ Arvi Jonnarth ⋅ Michael Felsberg ⋅ Marco Kuhlmann

Transfer Knowledge From Head to Tail: Uncertainty Calibration Under Long-Tailed Distribution

Jiahao Chen ⋅ Bing Su

FREDOM: Fairness Domain Adaptation Approach to Semantic Scene Understanding

Thanh-Dat Truong ⋅ Ngan Le ⋅ Bhiksha Raj ⋅ Jackson Cothren ⋅ Khoa Luu

COT: Unsupervised Domain Adaptation With Clustering and Optimal Transport

Yang Liu ⋅ Zhipeng Zhou ⋅ Baigui Sun

MHPL: Minimum Happy Points Learning for Active Source Free Domain Adaptation

Fan Wang ⋅ Zhongyi Han ⋅ Zhiyan Zhang ⋅ Rundong He ⋅ Yilong Yin

Upcycling Models Under Domain and Category Shift

Sanqing Qu ⋅ Tianpei Zou ⋅ Florian Röhrbein ⋅ Cewu Lu ⋅ Guang Chen ⋅ Dacheng Tao ⋅ Changjun Jiang

PMR: Prototypical Modal Rebalance for Multimodal Learning

Yunfeng Fan ⋅ Wenchao Xu ⋅ Haozhao Wang ⋅ Junxiao Wang ⋅ Song Guo

MMANet: Margin-Aware Distillation and Modality-Aware Regularization for Incomplete Multimodal Learning

Shicai Wei ⋅ Chunbo Luo ⋅ Yang Luo

Feature Alignment and Uniformity for Test Time Adaptation

Shuai Wang ⋅ Daoan Zhang ⋅ Zipei Yan ⋅ Jianguo Zhang ⋅ Rui Li

Revisiting Prototypical Network for Cross Domain Few-Shot Learning

Fei Zhou ⋅ Peng Wang ⋅ Lei Zhang ⋅ Wei Wei ⋅ Yanning Zhang

A Whac-a-Mole Dilemma: Shortcuts Come in Multiples Where Mitigating One Amplifies Others

Zhiheng Li ⋅ Ivan Evtimov ⋅ Albert Gordo ⋅ Caner Hazirbas ⋅ Tal Hassner ⋅ Cristian Canton Ferrer ⋅ Chenliang Xu ⋅ Mark Ibrahim

Independent Component Alignment for Multi-Task Learning

Dmitry Senushkin ⋅ Nikolay Patakin ⋅ Arseny Kuznetsov ⋅ Anton Konushin

MDL-NAS: A Joint Multi-Domain Learning Framework for Vision Transformer

Shiguang Wang ⋅ Tao Xie ⋅ Jian Cheng ⋅ Xingcheng Zhang ⋅ Haijun Liu

MELTR: Meta Loss Transformer for Learning To Fine-Tune Video Foundation Models

Dohwan Ko ⋅ Joonmyung Choi ⋅ Hyeong Kyu Choi ⋅ Kyoung-Woon On ⋅ Byungseok Roh ⋅ Hyunwoo J. Kim

1% VS 100%: Parameter-Efficient Low Rank Adapter for Dense Predictions

Dongshuo Yin ⋅ Yiran Yang ⋅ Zhechao Wang ⋅ Hongfeng Yu ⋅ Kaiwen Wei ⋅ Xian Sun

Rebalancing Batch Normalization for Exemplar-Based Class-Incremental Learning

Sungmin Cha ⋅ Sungjun Cho ⋅ Dasol Hwang ⋅ Sunwon Hong ⋅ Moontae Lee ⋅ Taesup Moon

Partial Network Cloning

Jingwen Ye ⋅ Songhua Liu ⋅ Xinchao Wang

ERM-KTP: Knowledge-Level Machine Unlearning via Knowledge Transfer

Shen Lin ⋅ Xiaoyu Zhang ⋅ Chenyang Chen ⋅ Xiaofeng Chen ⋅ Willy Susilo

Rethinking Feature-Based Knowledge Distillation for Face Recognition

Jingzhi Li ⋅ Zidong Guo ⋅ Hui Li ⋅ Seungju Han ⋅ Ji-won Baek ⋅ Min Yang ⋅ Ran Yang ⋅ Sungjoo Suh

Regularizing Second-Order Influences for Continual Learning

Zhicheng Sun ⋅ Yadong Mu ⋅ Gang Hua

Generalization Matters: Loss Minima Flattening via Parameter Hybridization for Efficient Online Knowledge Distillation

Tianli Zhang ⋅ Mengqi Xue ⋅ Jiangtao Zhang ⋅ Haofei Zhang ⋅ Yu Wang ⋅ Lechao Cheng ⋅ Jie Song ⋅ Mingli Song

Decoupling Learning and Remembering: A Bilevel Memory Framework With Knowledge Projection for Task-Incremental Learning

Wenju Sun ⋅ Qingyong Li ⋅ Jing Zhang ⋅ Wen Wang ⋅ Yangli-ao Geng

On the Stability-Plasticity Dilemma of Class-Incremental Learning

Dongwan Kim ⋅ Bohyung Han

Simulated Annealing in Early Layers Leads to Better Generalization

Amir M. Sarfi ⋅ Zahra Karimpour ⋅ Muawiz Chaudhary ⋅ Nasir M. Khalid ⋅ Mirco Ravanelli ⋅ Sudhir Mudur ⋅ Eugene Belilovsky

Frustratingly Easy Regularization on Representation Can Boost Deep Reinforcement Learning

Qiang He ⋅ Huangyuan Su ⋅ Jieyu Zhang ⋅ Xinwen Hou

Tunable Convolutions With Parametric Multi-Loss Optimization

Matteo Maggioni ⋅ Thomas Tanay ⋅ Francesca Babiloni ⋅ Steven McDonagh ⋅ Aleš Leonardis

Re-Basin via Implicit Sinkhorn Differentiation

Fidel A. Guerrero Peña ⋅ Heitor Rapela Medeiros ⋅ Thomas Dubail ⋅ Masih Aminbeidokhti ⋅ Eric Granger ⋅ Marco Pedersoli

Gradient Norm Aware Minimization Seeks First-Order Flatness and Improves Generalization

Xingxuan Zhang ⋅ Renzhe Xu ⋅ Han Yu ⋅ Hao Zou ⋅ Peng Cui

AstroNet: When Astrocyte Meets Artificial Neural Network

Mengqiao Han ⋅ Liyuan Pan ⋅ Xiabi Liu

Network Expansion for Practical Training Acceleration

Ning Ding ⋅ Yehui Tang ⋅ Kai Han ⋅ Chao Xu ⋅ Yunhe Wang

Defining and Quantifying the Emergence of Sparse Concepts in DNNs

Jie Ren ⋅ Mingjie Li ⋅ Qirui Chen ⋅ Huiqi Deng ⋅ Quanshi Zhang

Samples With Low Loss Curvature Improve Data Efficiency

Isha Garg ⋅ Kaushik Roy

Masked Images Are Counterfactual Samples for Robust Fine-Tuning

Yao Xiao ⋅ Ziyi Tang ⋅ Pengxu Wei ⋅ Cong Liu ⋅ Liang Lin

Bias Mimicking: A Simple Sampling Approach for Bias Mitigation

Maan Qraitem ⋅ Kate Saenko ⋅ Bryan A. Plummer

NoisyQuant: Noisy Bias-Enhanced Post-Training Activation Quantization for Vision Transformers

Yijiang Liu ⋅ Huanrui Yang ⋅ Zhen Dong ⋅ Kurt Keutzer ⋅ Li Du ⋅ Shanghang Zhang

Practical Network Acceleration With Tiny Sets

Guo-Hua Wang ⋅ Jianxin Wu

TeSLA: Test-Time Self-Learning With Automatic Adversarial Augmentation

Devavrat Tomar ⋅ Guillaume Vray ⋅ Behzad Bozorgtabar ⋅ Jean-Philippe Thiran

Discriminator-Cooperated Feature Map Distillation for GAN Compression

Tie Hu ⋅ Mingbao Lin ⋅ Lizhou You ⋅ Fei Chao ⋅ Rongrong Ji

Private Image Generation With Dual-Purpose Auxiliary Classifier

Chen Chen ⋅ Daochang Liu ⋅ Siqi Ma ⋅ Surya Nepal ⋅ Chang Xu

ImageNet-E: Benchmarking Neural Network Robustness via Attribute Editing

Xiaodan Li ⋅ Yuefeng Chen ⋅ Yao Zhu ⋅ Shuhui Wang ⋅ Rong Zhang ⋅ Hui Xue

Masked Jigsaw Puzzle: A Versatile Position Embedding for Vision Transformers

Bin Ren ⋅ Yahui Liu ⋅ Yue Song ⋅ Wei Bi ⋅ Rita Cucchiara ⋅ Nicu Sebe ⋅ Wei Wang

A New Comprehensive Benchmark for Semi-Supervised Video Anomaly Detection and Anticipation

Congqi Cao ⋅ Yue Lu ⋅ Peng Wang ⋅ Yanning Zhang

SimpleNet: A Simple Network for Image Anomaly Detection and Localization

Zhikang Liu ⋅ Yiming Zhou ⋅ Yuansheng Xu ⋅ Zilei Wang

DaFKD: Domain-Aware Federated Knowledge Distillation

Haozhao Wang ⋅ Yichen Li ⋅ Wenchao Xu ⋅ Ruixuan Li ⋅ Yufeng Zhan ⋅ Zhigang Zeng

Reliable and Interpretable Personalized Federated Learning

Zixuan Qin ⋅ Liu Yang ⋅ Qilong Wang ⋅ Yahong Han ⋅ Qinghua Hu

Adaptive Channel Sparsity for Federated Learning Under System Heterogeneity

Dongping Liao ⋅ Xitong Gao ⋅ Yiren Zhao ⋅ Cheng-Zhong Xu

Bias-Eliminating Augmentation Learning for Debiased Federated Learning

Yuan-Yi Xu ⋅ Ci-Siang Lin ⋅ Yu-Chiang Frank Wang

Instance-Aware Domain Generalization for Face Anti-Spoofing

Qianyu Zhou ⋅ Ke-Yue Zhang ⋅ Taiping Yao ⋅ Xuequan Lu ⋅ Ran Yi ⋅ Shouhong Ding ⋅ Lizhuang Ma

Adversarially Masking Synthetic To Mimic Real: Adaptive Noise Injection for Point Cloud Segmentation Adaptation

Guangrui Li ⋅ Guoliang Kang ⋅ Xiaohan Wang ⋅ Yunchao Wei ⋅ Yi Yang

Model Barrier: A Compact Un-Transferable Isolation Domain for Model Intellectual Property Protection

Lianyu Wang ⋅ Meng Wang ⋅ Daoqiang Zhang ⋅ Huazhu Fu

MEDIC: Remove Model Backdoors via Importance Driven Cloning

Qiuling Xu ⋅ Guanhong Tao ⋅ Jean Honorio ⋅ Yingqi Liu ⋅ Shengwei An ⋅ Guangyu Shen ⋅ Siyuan Cheng ⋅ Xiangyu Zhang

Progressive Backdoor Erasing via Connecting Backdoor and Adversarial Attacks

Bingxu Mu ⋅ Zhenxing Niu ⋅ Le Wang ⋅ Xue Wang ⋅ Qiguang Miao ⋅ Rong Jin ⋅ Gang Hua

Reinforcement Learning-Based Black-Box Model Inversion Attacks

Gyojin Han ⋅ Jaehyun Choi ⋅ Haeil Lee ⋅ Junmo Kim

T-SEA: Transfer-Based Self-Ensemble Attack on Object Detection

Hao Huang ⋅ Ziyan Chen ⋅ Huanran Chen ⋅ Yongtao Wang ⋅ Kevin Zhang

Proximal Splitting Adversarial Attack for Semantic Segmentation

Jérôme Rony ⋅ Jean-Christophe Pesquet ⋅ Ismail Ben Ayed

Towards Transferable Targeted Adversarial Examples

Zhibo Wang ⋅ Hongshan Yang ⋅ Yunhe Feng ⋅ Peng Sun ⋅ Hengchang Guo ⋅ Zhifei Zhang ⋅ Kui Ren

AGAIN: Adversarial Training With Attribution Span Enlargement and Hybrid Feature Fusion

Shenglin Yin ⋅ Kelu Yao ⋅ Sheng Shi ⋅ Yangzhou Du ⋅ Zhen Xiao

Generalist: Decoupling Natural and Robust Generalization

Hongjun Wang ⋅ Yisen Wang

Cooperation or Competition: Avoiding Player Domination for Multi-Target Robustness via Adaptive Budgets

Yimu Wang ⋅ Dinghuai Zhang ⋅ Yihan Wu ⋅ Heng Huang ⋅ Hongyang Zhang

Discrete Point-Wise Attack Is Not Enough: Generalized Manifold Adversarial Attack for Face Recognition

Qian Li ⋅ Yuxiao Hu ⋅ Ye Liu ⋅ Dongxiao Zhang ⋅ Xin Jin ⋅ Yuntian Chen

RIATIG: Reliable and Imperceptible Adversarial Text-to-Image Generation With Natural Prompts

Han Liu ⋅ Yuhao Wu ⋅ Shixuan Zhai ⋅ Bo Yuan ⋅ Ning Zhang

CLIP2Protect: Protecting Facial Privacy Using Text-Guided Makeup via Adversarial Latent Search

Fahad Shamshad ⋅ Muzammal Naseer ⋅ Karthik Nandakumar

TruFor: Leveraging All-Round Clues for Trustworthy Image Forgery Detection and Localization

Fabrizio Guillaro ⋅ Davide Cozzolino ⋅ Avneesh Sud ⋅ Nicholas Dufour ⋅ Luisa Verdoliva

Go to Event Page

Panel

Scientific Discovery and the Environment

Elizabeth A. Barnes ⋅ Sara Beery ⋅ Josh Bloom ⋅ Kyle Cranmer

2:00 PM - 3:00 PM

Award

Award Candidates THU

Andreas Geiger

3:00 PM - 4:00 PM

... more

Poster

Poster Session THU-PM

4:30 PM - 6:00 PM

393 Events in this session

High-Fidelity Event-Radiance Recovery via Transient Event Frequency

Jin Han ⋅ Yuta Asano ⋅ Boxin Shi ⋅ Yinqiang Zheng ⋅ Imari Sato

RobustNeRF: Ignoring Distractors With Robust Losses

Sara Sabour ⋅ Suhani Vora ⋅ Daniel Duckworth ⋅ Ivan Krasin ⋅ David J. Fleet ⋅ Andrea Tagliasacchi

NeRDi: Single-View NeRF Synthesis With Language-Guided Diffusion As General Image Priors

Congyue Deng ⋅ Chiyu “Max” Jiang ⋅ Charles R. Qi ⋅ Xinchen Yan ⋅ Yin Zhou ⋅ Leonidas Guibas ⋅ Dragomir Anguelov

GM-NeRF: Learning Generalizable Model-Based Neural Radiance Fields From Multi-View Images

Jianchuan Chen ⋅ Wentao Yi ⋅ Liqian Ma ⋅ Xu Jia ⋅ Huchuan Lu

MixNeRF: Modeling a Ray With Mixture Density for Novel View Synthesis From Sparse Inputs

Seunghyeon Seo ⋅ Donghoon Han ⋅ Yeonjin Chang ⋅ Nojun Kwak

SPIn-NeRF: Multiview Segmentation and Perceptual Inpainting With Neural Radiance Fields

Ashkan Mirzaei ⋅ Tristan Aumentado-Armstrong ⋅ Kosta Derpanis ⋅ Jonathan Kelly ⋅ Marcus A. Brubaker ⋅ Igor Gilitschenski ⋅ Alex Levinshtein

Masked Wavelet Representation for Compact Neural Radiance Fields

Daniel Rho ⋅ Byeonghyeon Lee ⋅ Seungtae Nam ⋅ Joo Chan Lee ⋅ Jong Hwan Ko ⋅ Eunbyung Park

PaletteNeRF: Palette-Based Appearance Editing of Neural Radiance Fields

Zhengfei Kuang ⋅ Fujun Luan ⋅ Sai Bi ⋅ Zhixin Shu ⋅ Gordon Wetzstein ⋅ Kalyan Sunkavalli

SteerNeRF: Accelerating NeRF Rendering via Smooth Viewpoint Trajectory

Sicheng Li ⋅ Hao Li ⋅ Yue Wang ⋅ Yiyi Liao ⋅ Lu Yu

Transforming Radiance Field With Lipschitz Network for Photorealistic 3D Scene Stylization

Zicheng Zhang ⋅ Yinglu Liu ⋅ Congying Han ⋅ Yingwei Pan ⋅ Tiande Guo ⋅ Ting Yao

Occlusion-Free Scene Recovery via Neural Radiance Fields

Chengxuan Zhu ⋅ Renjie Wan ⋅ Yunkai Tang ⋅ Boxin Shi

TriVol: Point Cloud Rendering via Triple Volumes

Tao Hu ⋅ Xiaogang Xu ⋅ Ruihang Chu ⋅ Jiaya Jia

DyNCA: Real-Time Dynamic Texture Synthesis Using Neural Cellular Automata

Ehsan Pajouheshgar ⋅ Yitao Xu ⋅ Tong Zhang ⋅ Sabine Süsstrunk

Neural Scene Chronology

Haotong Lin ⋅ Qianqian Wang ⋅ Ruojin Cai ⋅ Sida Peng ⋅ Hadar Averbuch-Elor ⋅ Xiaowei Zhou ⋅ Noah Snavely

ReLight My NeRF: A Dataset for Novel View Synthesis and Relighting of Real World Objects

Marco Toschi ⋅ Riccardo De Matteo ⋅ Riccardo Spezialetti ⋅ Daniele De Gregorio ⋅ Luigi Di Stefano ⋅ Samuele Salti

ORCa: Glossy Objects As Radiance-Field Cameras

Kushagra Tiwary ⋅ Akshat Dave ⋅ Nikhil Behari ⋅ Tzofi Klinghoffer ⋅ Ashok Veeraraghavan ⋅ Ramesh Raskar

Nighttime Smartphone Reflective Flare Removal Using Optical Center Symmetry Prior

Yuekun Dai ⋅ Yihang Luo ⋅ Shangchen Zhou ⋅ Chongyi Li ⋅ Chen Change Loy

SunStage: Portrait Reconstruction and Relighting Using the Sun as a Light Stage

Yifan Wang ⋅ Aleksander Holynski ⋅ Xiuming Zhang ⋅ Xuaner Zhang

The Differentiable Lens: Compound Lens Search Over Glass Surfaces and Materials for Object Detection

Geoffroi Côté ⋅ Fahim Mannan ⋅ Simon Thibault ⋅ Jean-François Lalonde ⋅ Felix Heide

Teleidoscopic Imaging System for Microscale 3D Shape Reconstruction

Ryo Kawahara ⋅ Meng-Yu Jennifer Kuo ⋅ Shohei Nobuhara

Looking Through the Glass: Neural Surface Reconstruction Against High Specular Reflections

Jiaxiong Qiu ⋅ Peng-Tao Jiang ⋅ Yifan Zhu ⋅ Ze-Xin Yin ⋅ Ming-Ming Cheng ⋅ Bo Ren

NeuralUDF: Learning Unsigned Distance Fields for Multi-View Reconstruction of Surfaces With Arbitrary Topologies

Xiaoxiao Long ⋅ Cheng Lin ⋅ Lingjie Liu ⋅ Yuan Liu ⋅ Peng Wang ⋅ Christian Theobalt ⋅ Taku Komura ⋅ Wenping Wang

Sphere-Guided Training of Neural Implicit Surfaces

Andreea Dogaru ⋅ Andrei-Timotei Ardelean ⋅ Savva Ignatyev ⋅ Egor Zakharov ⋅ Evgeny Burnaev

OReX: Object Reconstruction From Planar Cross-Sections Using Neural Fields

Haim Sawdayee ⋅ Amir Vaxman ⋅ Amit H. Bermano

Persistent Nature: A Generative Model of Unbounded 3D Worlds

Lucy Chai ⋅ Richard Tucker ⋅ Zhengqi Li ⋅ Phillip Isola ⋅ Noah Snavely

3D Neural Field Generation Using Triplane Diffusion

J. Ryan Shue ⋅ Eric Ryan Chan ⋅ Ryan Po ⋅ Zachary Ankner ⋅ Jiajun Wu ⋅ Gordon Wetzstein

Diffusion-Based Signed Distance Fields for 3D Shape Generation

Jaehyeok Shim ⋅ Changwoo Kang ⋅ Kyungdon Joo

Efficient View Synthesis and 3D-Based Multi-Frame Denoising With Multiplane Feature Representations

Thomas Tanay ⋅ Aleš Leonardis ⋅ Matteo Maggioni

Dream3D: Zero-Shot Text-to-3D Synthesis Using 3D Shape Prior and Text-to-Image Diffusion Models

Jiale Xu ⋅ Xintao Wang ⋅ Weihao Cheng ⋅ Yan-Pei Cao ⋅ Ying Shan ⋅ Xiaohu Qie ⋅ Shenghua Gao

SINE: Semantic-Driven Image-Based NeRF Editing With Prior-Guided Editing Field

Chong Bao ⋅ Yinda Zhang ⋅ Bangbang Yang ⋅ Tianxing Fan ⋅ Zesong Yang ⋅ Hujun Bao ⋅ Guofeng Zhang ⋅ Zhaopeng Cui

3D Highlighter: Localizing Regions on 3D Shapes via Text Descriptions

Dale Decatur ⋅ Itai Lang ⋅ Rana Hanocka

Self-Supervised Geometry-Aware Encoder for Style-Based 3D GAN Inversion

Yushi Lan ⋅ Xuyi Meng ⋅ Shuai Yang ⋅ Chen Change Loy ⋅ Bo Dai

PanoHead: Geometry-Aware 3D Full-Head Synthesis in 360°

Sizhe An ⋅ Hongyi Xu ⋅ Yichun Shi ⋅ Guoxian Song ⋅ Umit Y. Ogras ⋅ Linjie Luo

StyleGene: Crossover and Mutation of Region-Level Facial Genes for Kinship Face Synthesis

Hao Li ⋅ Xianxu Hou ⋅ Zepeng Huang ⋅ Linlin Shen

Parameter Efficient Local Implicit Image Function Network for Face Segmentation

Mausoom Sarkar ⋅ Nikitha SR ⋅ Mayur Hemani ⋅ Rishabh Jain ⋅ Balaji Krishnamurthy

Graphics Capsule: Learning Hierarchical 3D Face Representations From 2D Images

Chang Yu ⋅ Xiangyu Zhu ⋅ Xiaomei Zhang ⋅ Zhaoxiang Zhang ⋅ Zhen Lei

Next3D: Generative Neural Texture Rasterization for 3D-Aware Head Avatars

Jingxiang Sun ⋅ Xuan Wang ⋅ Lizhen Wang ⋅ Xiaoyu Li ⋅ Yong Zhang ⋅ Hongwen Zhang ⋅ Yebin Liu

Learning Neural Parametric Head Models

Simon Giebenhain ⋅ Tobias Kirschstein ⋅ Markos Georgopoulos ⋅ Martin Rünz ⋅ Lourdes Agapito ⋅ Matthias Nießner

Zero-Shot Text-to-Parameter Translation for Game Character Auto-Creation

Rui Zhao ⋅ Wei Li ⋅ Zhipeng Hu ⋅ Lincheng Li ⋅ Zhengxia Zou ⋅ Zhenwei Shi ⋅ Changjie Fan

Learning Locally Editable Virtual Humans

Hsuan-I Ho ⋅ Lixin Xue ⋅ Jie Song ⋅ Otmar Hilliges

Auto-CARD: Efficient and Robust Codec Avatar Driving for Real-Time Mobile Telepresence

Yonggan Fu ⋅ Yuecheng Li ⋅ Chenghui Li ⋅ Jason Saragih ⋅ Peizhao Zhang ⋅ Xiaoliang Dai ⋅ Yingyan (Celine) Lin

Ham2Pose: Animating Sign Language Notation Into Pose Sequences

Rotem Shalev Arkushin ⋅ Amit Moryossef ⋅ Ohad Fried

PointAvatar: Deformable Point-Based Head Avatars From Videos

Yufeng Zheng ⋅ Wang Yifan ⋅ Gordon Wetzstein ⋅ Michael J. Black ⋅ Otmar Hilliges

PAniC-3D: Stylized Single-View 3D Reconstruction From Portraits of Anime Characters

Shuhong Chen ⋅ Kevin Zhang ⋅ Yichun Shi ⋅ Heng Wang ⋅ Yiheng Zhu ⋅ Guoxian Song ⋅ Sizhe An ⋅ Janus Kristjansson ⋅ Xiao Yang ⋅ Matthias Zwicker

HandNeRF: Neural Radiance Fields for Animatable Interacting Hands

Zhiyang Guo ⋅ Wengang Zhou ⋅ Min Wang ⋅ Li Li ⋅ Houqiang Li

VGFlow: Visibility Guided Flow Network for Human Reposing

Rishabh Jain ⋅ Krishna Kumar Singh ⋅ Mayur Hemani ⋅ Jingwan Lu ⋅ Mausoom Sarkar ⋅ Duygu Ceylan ⋅ Balaji Krishnamurthy

Clothed Human Performance Capture With a Double-Layer Neural Radiance Fields

Kangkan Wang ⋅ Guofeng Zhang ⋅ Suxu Cong ⋅ Jian Yang

POEM: Reconstructing Hand in a Point Embedded Multi-View Stereo

Lixin Yang ⋅ Jian Xu ⋅ Licheng Zhong ⋅ Xinyu Zhan ⋅ Zhicheng Wang ⋅ Kejian Wu ⋅ Cewu Lu

FlexNeRF: Photorealistic Free-Viewpoint Rendering of Moving Humans From Sparse Views

Vinoj Jayasundara ⋅ Amit Agrawal ⋅ Nicolas Heron ⋅ Abhinav Shrivastava ⋅ Larry S. Davis

Flow Supervision for Deformable NeRF

Chaoyang Wang ⋅ Lachlan Ewen MacDonald ⋅ László A. Jeni ⋅ Simon Lucey

Building Rearticulable Models for Arbitrary 3D Objects From 4D Point Clouds

Shaowei Liu ⋅ Saurabh Gupta ⋅ Shenlong Wang

Implicit 3D Human Mesh Recovery Using Consistency With Pose and Shape From Unseen-View

Hanbyel Cho ⋅ Yooshin Cho ⋅ Jaesung Ahn ⋅ Junmo Kim

One-Stage 3D Whole-Body Mesh Recovery With Component Aware Transformer

Jing Lin ⋅ Ailing Zeng ⋅ Haoqian Wang ⋅ Lei Zhang ⋅ Yu Li

Im2Hands: Learning Attentive Implicit Representation of Interacting Two-Hand Shapes

Jihyun Lee ⋅ Minhyuk Sung ⋅ Honggyu Choi ⋅ Tae-Kyun Kim

FLEX: Full-Body Grasping Without Full-Body Grasps

Purva Tendulkar ⋅ Dídac Surís ⋅ Carl Vondrick

DexArt: Benchmarking Generalizable Dexterous Manipulation With Articulated Objects

Chen Bao ⋅ Helin Xu ⋅ Yuzhe Qin ⋅ Xiaolong Wang

CARTO: Category and Joint Agnostic Reconstruction of ARTiculated Objects

Nick Heppert ⋅ Zubair Irshad ⋅ Sergey Zakharov ⋅ Katherine Liu ⋅ Rares Andrei Ambrus ⋅ Jeannette Bohg ⋅ Abhinav Valada ⋅ Thomas Kollar

CIRCLE: Capture in Rich Contextual Environments

João Pedro Araújo ⋅ Jiaman Li ⋅ Karthik Vetrivel ⋅ Rishi Agarwal ⋅ Jiajun Wu ⋅ Deepak Gopinath ⋅ Alexander William Clegg ⋅ Karen Liu

Decoupling Human and Camera Motion From Videos in the Wild

Vickie Ye ⋅ Georgios Pavlakos ⋅ Jitendra Malik ⋅ Angjoo Kanazawa

GarmentTracking: Category-Level Garment Pose Tracking

Han Xue ⋅ Wenqiang Xu ⋅ Jieyi Zhang ⋅ Tutian Tang ⋅ Yutong Li ⋅ Wenxin Du ⋅ Ruolin Ye ⋅ Cewu Lu

Hierarchical Temporal Transformer for 3D Hand Pose Estimation and Action Recognition From Egocentric RGB Videos

Yilin Wen ⋅ Hao Pan ⋅ Lei Yang ⋅ Jia Pan ⋅ Taku Komura ⋅ Wenping Wang

PSVT: End-to-End Multi-Person 3D Pose and Shape Estimation With Progressive Video Transformers

Zhongwei Qiu ⋅ Qiansheng Yang ⋅ Jian Wang ⋅ Haocheng Feng ⋅ Junyu Han ⋅ Errui Ding ⋅ Chang Xu ⋅ Dongmei Fu ⋅ Jingdong Wang

Delving Into Discrete Normalizing Flows on SO(3) Manifold for Probabilistic Rotation Modeling

Yulin Liu ⋅ Haoran Liu ⋅ Yingda Yin ⋅ Yang Wang ⋅ Baoquan Chen ⋅ He Wang

3D-POP – An Automated Annotation Approach to Facilitate Markerless 2D-3D Tracking of Freely Moving Birds With Marker-Based Motion Capture

Hemal Naik ⋅ Alex Hoi Hang Chan ⋅ Junran Yang ⋅ Mathilde Delacoux ⋅ Iain D. Couzin ⋅ Fumihiro Kano ⋅ Máté Nagy

TTA-COPE: Test-Time Adaptation for Category-Level Object Pose Estimation

Taeyeop Lee ⋅ Jonathan Tremblay ⋅ Valts Blukis ⋅ Bowen Wen ⋅ Byeong-Uk Lee ⋅ Inkyu Shin ⋅ Stan Birchfield ⋅ In So Kweon ⋅ Kuk-Jin Yoon

Markerless Camera-to-Robot Pose Estimation via Self-Supervised Sim-to-Real Transfer

Jingpei Lu ⋅ Florian Richter ⋅ Michael C. Yip

SMOC-Net: Leveraging Camera Pose for Self-Supervised Monocular Object Pose Estimation

Tao Tan ⋅ Qiulei Dong

IMP: Iterative Matching and Pose Estimation With Adaptive Pooling

Fei Xue ⋅ Ignas Budvytis ⋅ Roberto Cipolla

Self-Supervised Representation Learning for CAD

Benjamin T. Jones ⋅ Michael Hu ⋅ Milin Kodnongbua ⋅ Vladimir G. Kim ⋅ Adriana Schulz

Few-Shot Geometry-Aware Keypoint Localization

Xingzhe He ⋅ Gaurav Bharaj ⋅ David Ferman ⋅ Helge Rhodin ⋅ Pablo Garrido

SparsePose: Sparse-View Camera Pose Regression and Refinement

Samarth Sinha ⋅ Jason Y. Zhang ⋅ Andrea Tagliasacchi ⋅ Igor Gilitschenski ⋅ David B. Lindell

A Large-Scale Homography Benchmark

Daniel Barath ⋅ Dmytro Mishkin ⋅ Michal Polic ⋅ Wolfgang Förstner ⋅ Jiri Matas

Learning Geometric-Aware Properties in 2D Representation Using Lightweight CAD Models, or Zero Real 3D Pairs

Pattaramanee Arsomngern ⋅ Sarana Nutanong ⋅ Supasorn Suwajanakorn

AutoRecon: Automated 3D Object Discovery and Reconstruction

Yuang Wang ⋅ Xingyi He ⋅ Sida Peng ⋅ Haotong Lin ⋅ Hujun Bao ⋅ Xiaowei Zhou

Multi-Sensor Large-Scale Dataset for Multi-View 3D Reconstruction

Oleg Voynov ⋅ Gleb Bobrovskikh ⋅ Pavel Karpyshev ⋅ Saveliy Galochkin ⋅ Andrei-Timotei Ardelean ⋅ Arseniy Bozhenko ⋅ Ekaterina Karmanova ⋅ Pavel Kopanev ⋅ Yaroslav Labutin-Rymsho ⋅ Ruslan Rakhimov ⋅ Aleksandr Safin ⋅ Valerii Serpiva ⋅ Alexey Artemov ⋅ Evgeny Burnaev ⋅ Dzmitry Tsetserukou ⋅ Denis Zorin

NeurOCS: Neural NOCS Supervision for Monocular 3D Object Localization

Zhixiang Min ⋅ Bingbing Zhuang ⋅ Samuel Schulter ⋅ Buyu Liu ⋅ Enrique Dunn ⋅ Manmohan Chandraker

Self-Supervised Super-Plane for Neural 3D Reconstruction

Botao Ye ⋅ Sifei Liu ⋅ Xueting Li ⋅ Ming-Hsuan Yang

PlaneDepth: Self-Supervised Depth Estimation via Orthogonal Planes

Ruoyu Wang ⋅ Zehao Yu ⋅ Shenghua Gao

Single View Scene Scale Estimation Using Scale Field

Byeong-Uk Lee ⋅ Jianming Zhang ⋅ Yannick Hold-Geoffroy ⋅ In So Kweon

3D Line Mapping Revisited

Shaohui Liu ⋅ Yifan Yu ⋅ Rémi Pautrat ⋅ Marc Pollefeys ⋅ Viktor Larsson

Inverting the Imaging Process by Learning an Implicit Camera Model

Xin Huang ⋅ Qi Zhang ⋅ Ying Feng ⋅ Hongdong Li ⋅ Qing Wang

SfM-TTR: Using Structure From Motion for Test-Time Refinement of Single-View Depth Networks

Sergio Izquierdo ⋅ Javier Civera

iDisc: Internal Discretization for Monocular Depth Estimation

Luigi Piccinelli ⋅ Christos Sakaridis ⋅ Fisher Yu

DC2: Dual-Camera Defocus Control by Learning To Refocus

Hadi Alzayer ⋅ Abdullah Abuolaim ⋅ Leung Chun Chan ⋅ Yang Yang ⋅ Ying Chen Lou ⋅ Jia-Bin Huang ⋅ Abhishek Kar

A Practical Stereo Depth System for Smart Glasses

Jialiang Wang ⋅ Daniel Scharstein ⋅ Akash Bapat ⋅ Kevin Blackburn-Matzen ⋅ Matthew Yu ⋅ Jonathan Lehman ⋅ Suhib Alsisan ⋅ Yanghan Wang ⋅ Sam Tsai ⋅ Jan-Michael Frahm ⋅ Zijian He ⋅ Peter Vajda ⋅ Michael F. Cohen ⋅ Matt Uyttendaele

GeoMVSNet: Learning Multi-View Stereo With Geometry Perception

Zhe Zhang ⋅ Rui Peng ⋅ Yuxi Hu ⋅ Ronggang Wang

DINN360: Deformable Invertible Neural Network for Latitude-Aware 360° Image Rescaling

Yichen Guo ⋅ Mai Xu ⋅ Lai Jiang ⋅ Leonid Sigal ⋅ Yunjin Chen

OmniVidar: Omnidirectional Depth Estimation From Multi-Fisheye Images

Sheng Xie ⋅ Daochuan Wang ⋅ Yun-Hui Liu

Learning To Fuse Monocular and Multi-View Cues for Multi-Frame Depth Estimation in Dynamic Scenes

Rui Li ⋅ Dong Gong ⋅ Wei Yin ⋅ Hao Chen ⋅ Yu Zhu ⋅ Kaixuan Wang ⋅ Xiaozhi Chen ⋅ Jinqiu Sun ⋅ Yanning Zhang

Modality-Invariant Visual Odometry for Embodied Vision

Marius Memmel ⋅ Roman Bachmann ⋅ Amir Zamir

VL-SAT: Visual-Linguistic Semantics Assisted Training for 3D Semantic Scene Graph Prediction in Point Cloud

Ziqin Wang ⋅ Bowen Cheng ⋅ Lichen Zhao ⋅ Dong Xu ⋅ Yang Tang ⋅ Lu Sheng

CAPE: Camera View Position Embedding for Multi-View 3D Object Detection

Kaixin Xiong ⋅ Shi Gong ⋅ Xiaoqing Ye ⋅ Xiao Tan ⋅ Ji Wan ⋅ Errui Ding ⋅ Jingdong Wang ⋅ Xiang Bai

AeDet: Azimuth-Invariant Multi-View 3D Object Detection

Chengjian Feng ⋅ Zequn Jie ⋅ Yujie Zhong ⋅ Xiangxiang Chu ⋅ Lin Ma

Object Detection With Self-Supervised Scene Adaptation

Zekun Zhang ⋅ Minh Hoai

Understanding the Robustness of 3D Object Detection With Bird’s-Eye-View Representations in Autonomous Driving

Zijian Zhu ⋅ Yichi Zhang ⋅ Hai Chen ⋅ Yinpeng Dong ⋅ Shu Zhao ⋅ Wenbo Ding ⋅ Jiachen Zhong ⋅ Shibao Zheng

BEVHeight: A Robust Framework for Vision-Based Roadside 3D Object Detection

Lei Yang ⋅ Kaicheng Yu ⋅ Tao Tang ⋅ Jun Li ⋅ Kun Yuan ⋅ Li Wang ⋅ Xinyu Zhang ⋅ Peng Chen

Uncertainty-Aware Vision-Based Metric Cross-View Geolocalization

Florian Fervers ⋅ Sebastian Bullinger ⋅ Christoph Bodensteiner ⋅ Michael Arens ⋅ Rainer Stiefelhagen

OrienterNet: Visual Localization in 2D Public Maps With Neural Matching

Paul-Edouard Sarlin ⋅ Daniel DeTone ⋅ Tsun-Yi Yang ⋅ Armen Avetisyan ⋅ Julian Straub ⋅ Tomasz Malisiewicz ⋅ Samuel Rota Bulò ⋅ Richard Newcombe ⋅ Peter Kontschieder ⋅ Vasileios Balntas

MSMDFusion: Fusing LiDAR and Camera at Multiple Scales With Multi-Depth Seeds for 3D Object Detection

Yang Jiao ⋅ Zequn Jie ⋅ Shaoxiang Chen ⋅ Jingjing Chen ⋅ Lin Ma ⋅ Yu-Gang Jiang

Virtual Sparse Convolution for Multimodal 3D Object Detection

Hai Wu ⋅ Chenglu Wen ⋅ Shaoshuai Shi ⋅ Xin Li ⋅ Cheng Wang

Optimal Transport Minimization: Crowd Localization on Density Maps for Semi-Supervised Counting

Wei Lin ⋅ Antoni B. Chan

VoxelNeXt: Fully Sparse VoxelNet for 3D Object Detection and Tracking

Yukang Chen ⋅ Jianhui Liu ⋅ Xiangyu Zhang ⋅ Xiaojuan Qi ⋅ Jiaya Jia

GraVoS: Voxel Selection for 3D Point-Cloud Detection

Oren Shrout ⋅ Yizhak Ben-Shabat ⋅ Ayellet Tal

MSeg3D: Multi-Modal 3D Semantic Segmentation for Autonomous Driving

Jiale Li ⋅ Hang Dai ⋅ Hao Han ⋅ Yong Ding

LaserMix for Semi-Supervised LiDAR Semantic Segmentation

Lingdong Kong ⋅ Jiawei Ren ⋅ Liang Pan ⋅ Ziwei Liu

Implicit Surface Contrastive Clustering for LiDAR Point Clouds

Zaiwei Zhang ⋅ Min Bai ⋅ Li Erran Li

Semi-Weakly Supervised Object Kinematic Motion Prediction

Gengxin Liu ⋅ Qian Sun ⋅ Haibin Huang ⋅ Chongyang Ma ⋅ Yulan Guo ⋅ Li Yi ⋅ Hui Huang ⋅ Ruizhen Hu

PartSLIP: Low-Shot Part Segmentation for 3D Point Clouds via Pretrained Image-Language Models

Minghua Liu ⋅ Yinhao Zhu ⋅ Hong Cai ⋅ Shizhong Han ⋅ Zhan Ling ⋅ Fatih Porikli ⋅ Hao Su

Learning Weather-General and Weather-Specific Features for Image Restoration Under Multiple Adverse Weather Conditions

Yurui Zhu ⋅ Tianyu Wang ⋅ Xueyang Fu ⋅ Xuanyu Yang ⋅ Xin Guo ⋅ Jifeng Dai ⋅ Yu Qiao ⋅ Xiaowei Hu

Geometry and Uncertainty-Aware 3D Point Cloud Class-Incremental Semantic Segmentation

Yuwei Yang ⋅ Munawar Hayat ⋅ Zhao Jin ⋅ Chao Ren ⋅ Yinjie Lei

Learning 3D Representations From 2D Pre-Trained Models via Image-to-Point Masked Autoencoders

Renrui Zhang ⋅ Liuhui Wang ⋅ Yu Qiao ⋅ Peng Gao ⋅ Hongsheng Li

ToThePoint: Efficient Contrastive Learning of 3D Point Clouds via Recycling

Xinglin Li ⋅ Jiajing Chen ⋅ Jinhui Ouyang ⋅ Hanhui Deng ⋅ Senem Velipasalar ⋅ Di Wu

PointDistiller: Structured Knowledge Distillation Towards Efficient and Compact 3D Detection

Linfeng Zhang ⋅ Runpei Dong ⋅ Hung-Shuo Tai ⋅ Kaisheng Ma

PointConvFormer: Revenge of the Point-Based Convolution

Wenxuan Wu ⋅ Li Fuxin ⋅ Qi Shan

Self-Positioning Point-Based Transformer for Point Cloud Understanding

Jinyoung Park ⋅ Sanghyeok Lee ⋅ Sihyeon Kim ⋅ Yunyang Xiong ⋅ Hyunwoo J. Kim

PointClustering: Unsupervised Point Cloud Pre-Training Using Transformation Invariance in Clustering

Fuchen Long ⋅ Ting Yao ⋅ Zhaofan Qiu ⋅ Lusong Li ⋅ Tao Mei

Neural Intrinsic Embedding for Non-Rigid Point Cloud Matching

Puhua Jiang ⋅ Mingze Sun ⋅ Ruqi Huang

HGNet: Learning Hierarchical Geometry From Points, Edges, and Surfaces

Ting Yao ⋅ Yehao Li ⋅ Yingwei Pan ⋅ Tao Mei

LP-DIF: Learning Local Pattern-Specific Deep Implicit Function for 3D Objects and Scenes

Meng Wang ⋅ Yu-Shen Liu ⋅ Yue Gao ⋅ Kanle Shi ⋅ Yi Fang ⋅ Zhizhong Han

Conjugate Product Graphs for Globally Optimal 2D-3D Shape Matching

Paul Roetzer ⋅ Zorah Lähner ⋅ Florian Bernard

UTM: A Unified Multiple Object Tracking Model With Identity-Aware Feature Enhancement

Sisi You ⋅ Hantao Yao ⋅ Bing-Kun Bao ⋅ Changsheng Xu

Learning Rotation-Equivariant Features for Visual Correspondence

Jongmin Lee ⋅ Byungjin Kim ⋅ Seungwook Kim ⋅ Minsu Cho

Adaptive Spot-Guided Transformer for Consistent Local Feature Matching

Jiahuan Yu ⋅ Jiahao Chang ⋅ Jianfeng He ⋅ Tianzhu Zhang ⋅ Jiyang Yu ⋅ Feng Wu

PMatch: Paired Masked Image Modeling for Dense Geometric Matching

Shengjie Zhu ⋅ Xiaoming Liu

Iterative Geometry Encoding Volume for Stereo Matching

Gangwei Xu ⋅ Xianqi Wang ⋅ Xiaohuan Ding ⋅ Xin Yang

Adaptive Annealing for Robust Geometric Estimation

Chitturi Sidhartha ⋅ Lalit Manam ⋅ Venu Madhav Govindu

Tangentially Elongated Gaussian Belief Propagation for Event-Based Incremental Optical Flow Estimation

Jun Nagata ⋅ Yusuke Sekikawa

Robust and Scalable Gaussian Process Regression and Its Applications

Yifan Lu ⋅ Jiayi Ma ⋅ Leyuan Fang ⋅ Xin Tian ⋅ Junjun Jiang

BEV-Guided Multi-Modality Fusion for Driving Perception

Yunze Man ⋅ Liang-Yan Gui ⋅ Yu-Xiong Wang

HumanBench: Towards General Human-Centric Perception With Projector Assisted Pretraining

Shixiang Tang ⋅ Cheng Chen ⋅ Qingsong Xie ⋅ Meilin Chen ⋅ Yizhou Wang ⋅ Yuanzheng Ci ⋅ Lei Bai ⋅ Feng Zhu ⋅ Haiyang Yang ⋅ Li Yi ⋅ Rui Zhao ⋅ Wanli Ouyang

Think Twice Before Driving: Towards Scalable Decoders for End-to-End Autonomous Driving

Xiaosong Jia ⋅ Penghao Wu ⋅ Li Chen ⋅ Jiangwei Xie ⋅ Conghui He ⋅ Junchi Yan ⋅ Hongyang Li

ProphNet: Efficient Agent-Centric Motion Forecasting With Anchor-Informed Proposals

Xishun Wang ⋅ Tong Su ⋅ Fang Da ⋅ Xiaodong Yang

StarCraftImage: A Dataset for Prototyping Spatial Reasoning Methods for Multi-Agent Environments

Sean Kulinski ⋅ Nicholas R. Waytowich ⋅ James Z. Hare ⋅ David I. Inouye

Stimulus Verification Is a Universal and Effective Sampler in Multi-Modal Human Trajectory Prediction

Jianhua Sun ⋅ Yuxuan Li ⋅ Liang Chai ⋅ Cewu Lu

PyPose: A Library for Robot Learning With Physics-Based Optimization

Chen Wang ⋅ Dasong Gao ⋅ Kuan Xu ⋅ Junyi Geng ⋅ Yaoyu Hu ⋅ Yuheng Qiu ⋅ Bowen Li ⋅ Fan Yang ⋅ Brady Moon ⋅ Abhinav Pandey ⋅ Aryan ⋅ Jiahe Xu ⋅ Tianhao Wu ⋅ Haonan He ⋅ Daning Huang ⋅ Zhongqiang Ren ⋅ Shibo Zhao ⋅ Taimeng Fu ⋅ Pranay Reddy ⋅ Xiao Lin ⋅ Wenshan Wang ⋅ Jingnan Shi ⋅ Rajat Talak ⋅ Kun Cao ⋅ Yi Du ⋅ Han Wang ⋅ Huai Yu ⋅ Shanzhao Wang ⋅ Siyu Chen ⋅ Ananth Kashyap ⋅ Rohan Bandaru ⋅ Karthik Dantu ⋅ Jiajun Wu ⋅ Lihua Xie ⋅ Luca Carlone ⋅ Marco Hutter ⋅ Sebastian Scherer

Source-Free Adaptive Gaze Estimation by Uncertainty Reduction

Xin Cai ⋅ Jiabei Zeng ⋅ Shiguang Shan ⋅ Xilin Chen

Camouflaged Object Detection With Feature Decomposition and Edge Reconstruction

Chunming He ⋅ Kai Li ⋅ Yachao Zhang ⋅ Longxiang Tang ⋅ Yulun Zhang ⋅ Zhenhua Guo ⋅ Xiu Li

MOTRv2: Bootstrapping End-to-End Multi-Object Tracking by Pretrained Object Detectors

Yuang Zhang ⋅ Tiancai Wang ⋅ Xiangyu Zhang

Clothing-Change Feature Augmentation for Person Re-Identification

Ke Han ⋅ Shaogang Gong ⋅ Yan Huang ⋅ Liang Wang ⋅ Tieniu Tan

Dynamic Aggregated Network for Gait Recognition

Kang Ma ⋅ Ying Fu ⋅ Dezhi Zheng ⋅ Chunshui Cao ⋅ Xuecai Hu ⋅ Yongzhen Huang

Feature Representation Learning With Adaptive Displacement Generation and Transformer Fusion for Micro-Expression Recognition

Zhijun Zhai ⋅ Jianhui Zhao ⋅ Chengjiang Long ⋅ Wenju Xu ⋅ Shuangjiang He ⋅ Huijuan Zhao

MetaPortrait: Identity-Preserving Talking Head Generation With Fast Personalized Adaptation

Bowen Zhang ⋅ Chenyang Qi ⋅ Pan Zhang ⋅ Bo Zhang ⋅ HsiangTao Wu ⋅ Dong Chen ⋅ Qifeng Chen ⋅ Yong Wang ⋅ Fang Wen

FLAG3D: A 3D Fitness Activity Dataset With Language Instruction

Yansong Tang ⋅ Jinpeng Liu ⋅ Aoyang Liu ⋅ Bin Yang ⋅ Wenxun Dai ⋅ Yongming Rao ⋅ Jiwen Lu ⋅ Jie Zhou ⋅ Xiu Li

TranSG: Transformer-Based Skeleton Graph Prototype Contrastive Learning With Structure-Trajectory Prompted Reconstruction for Person Re-Identification

Haocong Rao ⋅ Chunyan Miao

NeMo: Learning 3D Neural Motion Fields From Multiple Video Instances of the Same Action

Kuan-Chieh Wang ⋅ Zhenzhen Weng ⋅ Maria Xenochristou ⋅ João Pedro Araújo ⋅ Jeffrey Gu ⋅ Karen Liu ⋅ Serena Yeung

Unsupervised Space-Time Network for Temporally-Consistent Segmentation of Multiple Motions

Etienne Meunier ⋅ Patrick Bouthemy

Deep Polarization Reconstruction With PDAVIS Events

Haiyang Mei ⋅ Zuowen Wang ⋅ Xin Yang ⋅ Xiaopeng Wei ⋅ Tobi Delbruck

Range-Nullspace Video Frame Interpolation With Focalized Motion Estimation

Zhiyang Yu ⋅ Yu Zhang ⋅ Dongqing Zou ⋅ Xijun Chen ⋅ Jimmy S. Ren ⋅ Shunqing Ren

Exploring Motion Ambiguity and Alignment for High-Quality Video Frame Interpolation

Kun Zhou ⋅ Wenbo Li ⋅ Xiaoguang Han ⋅ Jiangbo Lu

1000 FPS HDR Video With a Spike-RGB Hybrid Camera

Yakun Chang ⋅ Chu Zhou ⋅ Yuchen Hong ⋅ Liwen Hu ⋅ Chao Xu ⋅ Tiejun Huang ⋅ Boxin Shi

Deep Discriminative Spatial and Temporal Network for Efficient Video Deblurring

Jinshan Pan ⋅ Boming Xu ⋅ Jiangxin Dong ⋅ Jianjun Ge ⋅ Jinhui Tang

Gated Multi-Resolution Transfer Network for Burst Restoration and Enhancement

Nancy Mehta ⋅ Akshay Dudhane ⋅ Subrahmanyam Murala ⋅ Syed Waqas Zamir ⋅ Salman Khan ⋅ Fahad Shahbaz Khan

A Unified HDR Imaging Method With Pixel and Patch Level

Qingsen Yan ⋅ Weiye Chen ⋅ Song Zhang ⋅ Yu Zhu ⋅ Jinqiu Sun ⋅ Yanning Zhang

BiasBed – Rigorous Texture Bias Evaluation

Nikolai Kalischek ⋅ Rodrigo Caye Daudt ⋅ Torben Peters ⋅ Reinhard Furrer ⋅ Jan D. Wegner ⋅ Konrad Schindler

Learning a Practical SDR-to-HDRTV Up-Conversion Using New Dataset and Degradation Models

Cheng Guo ⋅ Leidong Fan ⋅ Ziyu Xue ⋅ Xiuhua Jiang

Learning a Deep Color Difference Metric for Photographic Images

Haoyu Chen ⋅ Zhihua Wang ⋅ Yang Yang ⋅ Qilin Sun ⋅ Kede Ma

Learning a Simple Low-Light Image Enhancer From Paired Low-Light Instances

Zhenqi Fu ⋅ Yan Yang ⋅ Xiaotong Tu ⋅ Yue Huang ⋅ Xinghao Ding ⋅ Kai-Kuang Ma

Residual Degradation Learning Unfolding Framework With Mixing Priors Across Spectral and Spatial for Compressive Spectral Imaging

Yubo Dong ⋅ Dahua Gao ⋅ Tian Qiu ⋅ Yuyan Li ⋅ Minxi Yang ⋅ Guangming Shi

Toward Stable, Interpretable, and Lightweight Hyperspectral Super-Resolution

Wen-jin Guo ⋅ Weiying Xie ⋅ Kai Jiang ⋅ Yunsong Li ⋅ Jie Lei ⋅ Leyuan Fang

RIDCP: Revitalizing Real Image Dehazing via High-Quality Codebook Priors

Rui-Qi Wu ⋅ Zheng-Peng Duan ⋅ Chun-Le Guo ⋅ Zhi Chai ⋅ Chongyi Li

Robust Unsupervised StyleGAN Image Restoration

Yohan Poirier-Ginter ⋅ Jean-François Lalonde

Quality-Aware Pre-Trained Models for Blind Image Quality Assessment

Kai Zhao ⋅ Kun Yuan ⋅ Ming Sun ⋅ Mading Li ⋅ Xing Wen

Learning To Exploit the Sequence-Specific Prior Knowledge for Image Processing Pipelines Optimization

Haina Qin ⋅ Longfei Han ⋅ Weihua Xiong ⋅ Juan Wang ⋅ Wentao Ma ⋅ Bing Li ⋅ Weiming Hu

Multi-Realism Image Compression With a Conditional Generator

Eirikur Agustsson ⋅ David Minnen ⋅ George Toderici ⋅ Fabian Mentzer

RGB No More: Minimally-Decoded JPEG Vision Transformers

Jeongsoo Park ⋅ Justin Johnson

Kernel Aware Resampler

Michael Bernasconi ⋅ Abdelaziz Djelouah ⋅ Farnood Salehi ⋅ Markus Gross ⋅ Christopher Schroers

Spatial-Frequency Mutual Learning for Face Super-Resolution

Chenyang Wang ⋅ Junjun Jiang ⋅ Zhiwei Zhong ⋅ Xianming Liu

Activating More Pixels in Image Super-Resolution Transformer

Xiangyu Chen ⋅ Xintao Wang ⋅ Jiantao Zhou ⋅ Yu Qiao ⋅ Chao Dong

Omni Aggregation Networks for Lightweight Image Super-Resolution

Hang Wang ⋅ Xuanhong Chen ⋅ Bingbing Ni ⋅ Yutian Liu ⋅ Jinfan Liu

Towards Artistic Image Aesthetics Assessment: A Large-Scale Dataset and a New Method

Ran Yi ⋅ Haoyuan Tian ⋅ Zhihao Gu ⋅ Yu-Kun Lai ⋅ Paul L. Rosin

RWSC-Fusion: Region-Wise Style-Controlled Fusion Network for the Prohibited X-Ray Security Image Synthesis

Luwen Duan ⋅ Min Wu ⋅ Lijian Mao ⋅ Jun Yin ⋅ Jianping Xiong ⋅ Xi Li

Efficient Scale-Invariant Generator With Column-Row Entangled Pixel Synthesis

Thuan Hoang Nguyen ⋅ Thanh Van Le ⋅ Anh Tran

Masked and Adaptive Transformer for Exemplar Based Image Translation

Chang Jiang ⋅ Fei Gao ⋅ Biao Ma ⋅ Yuhao Lin ⋅ Nannan Wang ⋅ Gang Xu

SmartBrush: Text and Shape Guided Object Inpainting With Diffusion Model

Shaoan Xie ⋅ Zhifei Zhang ⋅ Zhe Lin ⋅ Tobias Hinz ⋅ Kun Zhang

Neural Transformation Fields for Arbitrary-Styled Font Generation

Bin Fu ⋅ Junjun He ⋅ Jianjun Wang ⋅ Yu Qiao

Referring Image Matting

Jizhizi Li ⋅ Jing Zhang ⋅ Dacheng Tao

Handwritten Text Generation From Visual Archetypes

Vittorio Pippi ⋅ Silvia Cascianelli ⋅ Rita Cucchiara

SceneComposer: Any-Level Semantic Image Synthesis

Yu Zeng ⋅ Zhe Lin ⋅ Jianming Zhang ⋅ Qing Liu ⋅ John Collomosse ⋅ Jason Kuen ⋅ Vishal M. Patel

Affordance Diffusion: Synthesizing Hand-Object Interactions

Yufei Ye ⋅ Xueting Li ⋅ Abhinav Gupta ⋅ Shalini De Mello ⋅ Stan Birchfield ⋅ Jiaming Song ⋅ Shubham Tulsiani ⋅ Sifei Liu

LayoutDiffusion: Controllable Diffusion Model for Layout-to-Image Generation

Guangcong Zheng ⋅ Xianpan Zhou ⋅ Xuewei Li ⋅ Zhongang Qi ⋅ Ying Shan ⋅ Xi Li

DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation

Nataniel Ruiz ⋅ Yuanzhen Li ⋅ Varun Jampani ⋅ Yael Pritch ⋅ Michael Rubinstein ⋅ Kfir Aberman

GLIGEN: Open-Set Grounded Text-to-Image Generation

Yuheng Li ⋅ Haotian Liu ⋅ Qingyang Wu ⋅ Fangzhou Mu ⋅ Jianwei Yang ⋅ Jianfeng Gao ⋅ Chunyuan Li ⋅ Yong Jae Lee

Safe Latent Diffusion: Mitigating Inappropriate Degeneration in Diffusion Models

Patrick Schramowski ⋅ Manuel Brack ⋅ Björn Deiseroth ⋅ Kristian Kersting

EDICT: Exact Diffusion Inversion via Coupled Transformations

Bram Wallace ⋅ Akash Gokul ⋅ Nikhil Naik

Solving 3D Inverse Problems Using Pre-Trained 2D Diffusion Models

Hyungjin Chung ⋅ Dohoon Ryu ⋅ Michael T. McCann ⋅ Marc L. Klasky ⋅ Jong Chul Ye

Diffusion Probabilistic Model Made Slim

Xingyi Yang ⋅ Daquan Zhou ⋅ Jiashi Feng ⋅ Xinchao Wang

Align Your Latents: High-Resolution Video Synthesis With Latent Diffusion Models

Andreas Blattmann ⋅ Robin Rombach ⋅ Huan Ling ⋅ Tim Dockhorn ⋅ Seung Wook Kim ⋅ Sanja Fidler ⋅ Karsten Kreis

Binary Latent Diffusion

Ze Wang ⋅ Jiang Wang ⋅ Zicheng Liu ⋅ Qiang Qiu

Semi-Supervised Video Inpainting With Cycle Consistency Constraints

Zhiliang Wu ⋅ Hanyu Xuan ⋅ Changchang Sun ⋅ Weili Guan ⋅ Kang Zhang ⋅ Yan Yan

Towards Accurate Image Coding: Improved Autoregressive Image Generation With Dynamic Vector Quantization

Mengqi Huang ⋅ Zhendong Mao ⋅ Zhuowei Chen ⋅ Yongdong Zhang

Large-Capacity and Flexible Video Steganography via Invertible Neural Network

Chong Mou ⋅ Youmin Xu ⋅ Jiechong Song ⋅ Chen Zhao ⋅ Bernard Ghanem ⋅ Jian Zhang

Neural Video Compression With Diverse Contexts

Jiahao Li ⋅ Bin Li ⋅ Yan Lu

Efficient Semantic Segmentation by Altering Resolutions for Compressed Videos

Yubin Hu ⋅ Yuze He ⋅ Yanghao Li ⋅ Jisheng Li ⋅ Yuxing Han ⋅ Jiangtao Wen ⋅ Yong-Jin Liu

Structured Sparsity Learning for Efficient Video Super-Resolution

Bin Xia ⋅ Jingwen He ⋅ Yulun Zhang ⋅ Yitong Wang ⋅ Yapeng Tian ⋅ Wenming Yang ⋅ Luc Van Gool

DisCo-CLIP: A Distributed Contrastive Loss for Memory Efficient CLIP Training

Yihao Chen ⋅ Xianbiao Qi ⋅ Jianan Wang ⋅ Lei Zhang

Boost Vision Transformer With GPU-Friendly Sparsity and Quantization

Chong Yu ⋅ Tao Chen ⋅ Zhongxue Gan ⋅ Jiayuan Fan

All Are Worth Words: A ViT Backbone for Diffusion Models

Fan Bao ⋅ Shen Nie ⋅ Kaiwen Xue ⋅ Yue Cao ⋅ Chongxuan Li ⋅ Hang Su ⋅ Jun Zhu

Sparsifiner: Learning Sparse Instance-Dependent Attention for Efficient Vision Transformers

Cong Wei ⋅ Brendan Duke ⋅ Ruowei Jiang ⋅ Parham Aarabi ⋅ Graham W. Taylor ⋅ Florian Shkurti

Vision Transformer With Super Token Sampling

Huaibo Huang ⋅ Xiaoqiang Zhou ⋅ Jie Cao ⋅ Ran He ⋅ Tieniu Tan

DropKey for Vision Transformer

Bonan Li ⋅ Yinhan Hu ⋅ Xuecheng Nie ⋅ Congying Han ⋅ Xiangjian Jiang ⋅ Tiande Guo ⋅ Luoqi Liu

Seeing Beyond the Brain: Conditional Diffusion Model With Sparse Masked Modeling for Vision Decoding

Zijiao Chen ⋅ Jiaxin Qing ⋅ Tiange Xiang ⋅ Wan Lin Yue ⋅ Juan Helen Zhou

ResFormer: Scaling ViTs With Multi-Resolution Training

Rui Tian ⋅ Zuxuan Wu ⋅ Qi Dai ⋅ Han Hu ⋅ Yu Qiao ⋅ Yu-Gang Jiang

Stare at What You See: Masked Image Modeling Without Reconstruction

Hongwei Xue ⋅ Peng Gao ⋅ Hongyang Li ⋅ Yu Qiao ⋅ Hao Sun ⋅ Houqiang Li ⋅ Jiebo Luo

Mixed Autoencoder for Self-Supervised Visual Representation Learning

Kai Chen ⋅ Zhili Liu ⋅ Lanqing Hong ⋅ Hang Xu ⋅ Zhenguo Li ⋅ Dit-Yan Yeung

Shape-Erased Feature Learning for Visible-Infrared Person Re-Identification

Jiawei Feng ⋅ Ancong Wu ⋅ Wei-Shi Zheng

G-MSM: Unsupervised Multi-Shape Matching With Graph-Based Affinity Priors

Marvin Eisenberger ⋅ Aysim Toker ⋅ Laura Leal-Taixé ⋅ Daniel Cremers

Efficient Mask Correction for Click-Based Interactive Image Segmentation

Fei Du ⋅ Jianlong Yuan ⋅ Zhibin Wang ⋅ Fan Wang

Prototype-Based Embedding Network for Scene Graph Generation

Chaofan Zheng ⋅ Xinyu Lyu ⋅ Lianli Gao ⋅ Bo Dai ⋅ Jingkuan Song

Graph Representation for Order-Aware Visual Transformation

Yue Qiu ⋅ Yanjun Sun ⋅ Fumiya Matsuzawa ⋅ Kenji Iwata ⋅ Hirokatsu Kataoka

Unbiased Scene Graph Generation in Videos

Sayak Nag ⋅ Kyle Min ⋅ Subarna Tripathi ⋅ Amit K. Roy-Chowdhury

Recurrence Without Recurrence: Stable Video Landmark Detection With Deep Equilibrium Models

Paul Micaelli ⋅ Arash Vahdat ⋅ Hongxu Yin ⋅ Jan Kautz ⋅ Pavlo Molchanov

VideoTrack: Learning To Track Objects via Video Transformer

Fei Xie ⋅ Lei Chu ⋅ Jiahao Li ⋅ Yan Lu ⋅ Chao Ma

Breaking the “Object” in Video Object Segmentation

Pavel Tokmakov ⋅ Jie Li ⋅ Adrien Gaidon

Hierarchical Semantic Contrast for Scene-Aware Video Anomaly Detection

Shengyang Sun ⋅ Xiaojin Gong

Mask-Free Video Instance Segmentation

Lei Ke ⋅ Martin Danelljan ⋅ Henghui Ding ⋅ Yu-Wing Tai ⋅ Chi-Keung Tang ⋅ Fisher Yu

Hierarchical Neural Memory Network for Low Latency Event Processing

Ryuhei Hamaguchi ⋅ Yasutaka Furukawa ⋅ Masaki Onishi ⋅ Ken Sakurada

Unifying Short and Long-Term Tracking With Graph Hierarchies

Orcun Cetintas ⋅ Guillem Brasó ⋅ Laura Leal-Taixé

Towards End-to-End Generative Modeling of Long Videos With Memory-Efficient Bidirectional Transformers

Jaehoon Yoo ⋅ Semin Kim ⋅ Doyup Lee ⋅ Chiheon Kim ⋅ Seunghoon Hong

An Empirical Study of End-to-End Video-Language Transformers With Masked Visual Modeling

Tsu-Jui Fu ⋅ Linjie Li ⋅ Zhe Gan ⋅ Kevin Lin ⋅ William Yang Wang ⋅ Lijuan Wang ⋅ Zicheng Liu

Egocentric Audio-Visual Object Localization

Chao Huang ⋅ Yapeng Tian ⋅ Anurag Kumar ⋅ Chenliang Xu

AVFormer: Injecting Vision Into Frozen Speech Models for Zero-Shot AV-ASR

Paul Hongsuck Seo ⋅ Arsha Nagrani ⋅ Cordelia Schmid

A Light Weight Model for Active Speaker Detection

Junhua Liao ⋅ Haihan Duan ⋅ Kanghui Feng ⋅ Wanbing Zhao ⋅ Yanbing Yang ⋅ Liangyin Chen

Dense-Localizing Audio-Visual Events in Untrimmed Videos: A Large-Scale Benchmark and Baseline

Tiantian Geng ⋅ Teng Wang ⋅ Jinming Duan ⋅ Runmin Cong ⋅ Feng Zheng

Video Test-Time Adaptation for Action Recognition

Wei Lin ⋅ Muhammad Jehanzeb Mirza ⋅ Mateusz Kozinski ⋅ Horst Possegger ⋅ Hilde Kuehne ⋅ Horst Bischof

Unified Keypoint-Based Action Recognition Framework via Structured Keypoint Pooling

Ryo Hachiuma ⋅ Fumiaki Sato ⋅ Taiki Sekii

Object Discovery From Motion-Guided Tokens

Zhipeng Bao ⋅ Pavel Tokmakov ⋅ Yu-Xiong Wang ⋅ Adrien Gaidon ⋅ Martial Hebert

Open Set Action Recognition via Multi-Label Evidential Learning

Chen Zhao ⋅ Dawei Du ⋅ Anthony Hoogs ⋅ Christopher Funk

PivoTAL: Prior-Driven Supervision for Weakly-Supervised Temporal Action Localization

Mamshad Nayeem Rizve ⋅ Gaurav Mittal ⋅ Ye Yu ⋅ Matthew Hall ⋅ Sandra Sajeev ⋅ Mubarak Shah ⋅ Mei Chen

Improving Weakly Supervised Temporal Action Localization by Bridging Train-Test Gap in Pseudo Labels

Jingqiu Zhou ⋅ Linjiang Huang ⋅ Liang Wang ⋅ Si Liu ⋅ Hongsheng Li

Are Binary Annotations Sufficient? Video Moment Retrieval via Hierarchical Uncertainty-Based Active Learning

Wei Ji ⋅ Renjie Liang ⋅ Zhedong Zheng ⋅ Wenqiao Zhang ⋅ Shengyu Zhang ⋅ Juncheng Li ⋅ Mengze Li ⋅ Tat-seng Chua

Query-Dependent Video Representation for Moment Retrieval and Highlight Detection

WonJun Moon ⋅ Sangeek Hyun ⋅ SangUk Park ⋅ Dongchan Park ⋅ Jae-Pil Heo

Vita-CLIP: Video and Text Adaptive CLIP via Multimodal Prompting

Syed Talal Wasim ⋅ Muzammal Naseer ⋅ Salman Khan ⋅ Fahad Shahbaz Khan ⋅ Mubarak Shah

Towards Generalisable Video Moment Retrieval: Visual-Dynamic Injection to Image-Text Pre-Training

Dezhao Luo ⋅ Jiabo Huang ⋅ Shaogang Gong ⋅ Hailin Jin ⋅ Yang Liu

Hierarchical Video-Moment Retrieval and Step-Captioning

Abhay Zala ⋅ Jaemin Cho ⋅ Satwik Kottur ⋅ Xilun Chen ⋅ Barlas Oguz ⋅ Yashar Mehdad ⋅ Mohit Bansal

HierVL: Learning Hierarchical Video-Language Embeddings

Kumar Ashutosh ⋅ Rohit Girdhar ⋅ Lorenzo Torresani ⋅ Kristen Grauman

Learning Transferable Spatiotemporal Representations From Natural Script Knowledge

Ziyun Zeng ⋅ Yuying Ge ⋅ Xihui Liu ⋅ Bin Chen ⋅ Ping Luo ⋅ Shu-Tao Xia ⋅ Yixiao Ge

WINNER: Weakly-Supervised hIerarchical decompositioN and aligNment for Spatio-tEmporal Video gRounding

Mengze Li ⋅ Han Wang ⋅ Wenqiao Zhang ⋅ Jiaxu Miao ⋅ Zhou Zhao ⋅ Shengyu Zhang ⋅ Wei Ji ⋅ Fei Wu

Collaborative Static and Dynamic Vision-Language Streams for Spatio-Temporal Video Grounding

Zihang Lin ⋅ Chaolei Tan ⋅ Jian-Fang Hu ⋅ Zhi Jin ⋅ Tiancai Ye ⋅ Wei-Shi Zheng

Learning Action Changes by Measuring Verb-Adverb Textual Relationships

Davide Moltisanti ⋅ Frank Keller ⋅ Hakan Bilen ⋅ Laura Sevilla-Lara

LAVENDER: Unifying Video-Language Understanding As Masked Language Modeling

Linjie Li ⋅ Zhe Gan ⋅ Kevin Lin ⋅ Chung-Ching Lin ⋅ Zicheng Liu ⋅ Ce Liu ⋅ Lijuan Wang

DeCo: Decomposition and Reconstruction for Compositional Temporal Grounding via Coarse-To-Fine Contrastive Ranking

Lijin Yang ⋅ Quan Kong ⋅ Hsuan-Kung Yang ⋅ Wadim Kehl ⋅ Yoichi Sato ⋅ Norimasa Kobori

CVT-SLR: Contrastive Visual-Textual Transformation for Sign Language Recognition With Variational Alignment

Jiangbin Zheng ⋅ Yile Wang ⋅ Cheng Tan ⋅ Siyuan Li ⋅ Ge Wang ⋅ Jun Xia ⋅ Yidong Chen ⋅ Stan Z. Li

Joint Visual Grounding and Tracking With Natural Language Specification

Li Zhou ⋅ Zikun Zhou ⋅ Kaige Mao ⋅ Zhenyu He

Accelerating Vision-Language Pretraining With Free Language Modeling

Teng Wang ⋅ Yixiao Ge ⋅ Feng Zheng ⋅ Ran Cheng ⋅ Ying Shan ⋅ Xiaohu Qie ⋅ Ping Luo

CoWs on Pasture: Baselines and Benchmarks for Language-Driven Zero-Shot Object Navigation

Samir Yitzhak Gadre ⋅ Mitchell Wortsman ⋅ Gabriel Ilharco ⋅ Ludwig Schmidt ⋅ Shuran Song

Where We Are and What We’re Looking At: Query Based Worldwide Image Geo-Localization Using Hierarchies and Scenes

Brandon Clark ⋅ Alec Kerrigan ⋅ Parth Parag Kulkarni ⋅ Vicente Vivanco Cepeda ⋅ Mubarak Shah

ANetQA: A Large-Scale Benchmark for Fine-Grained Compositional Reasoning Over Untrimmed Videos

Zhou Yu ⋅ Lixiang Zheng ⋅ Zhou Zhao ⋅ Fei Wu ⋅ Jianping Fan ⋅ Kui Ren ⋅ Jun Yu

MetaCLUE: Towards Comprehensive Visual Metaphors Research

Arjun R. Akula ⋅ Brendan Driscoll ⋅ Pradyumna Narayana ⋅ Soravit Changpinyo ⋅ Zhiwei Jia ⋅ Suyash Damle ⋅ Garima Pruthi ⋅ Sugato Basu ⋅ Leonidas Guibas ⋅ William Freeman ⋅ Yuanzhen Li ⋅ Varun Jampani

GeoVLN: Learning Geometry-Enhanced Visual Representation With Slot Attention for Vision-and-Language Navigation

Jingyang Huo ⋅ Qiang Sun ⋅ Boyan Jiang ⋅ Haitao Lin ⋅ Yanwei Fu

Being Comes From Not-Being: Open-Vocabulary Text-to-Motion Generation With Wordless Training

Junfan Lin ⋅ Jianlong Chang ⋅ Lingbo Liu ⋅ Guanbin Li ⋅ Liang Lin ⋅ Qi Tian ⋅ Chang-Wen Chen

LASP: Text-to-Text Optimization for Language-Aware Soft Prompting of Vision & Language Models

Adrian Bulat ⋅ Georgios Tzimiropoulos

Position-Guided Text Prompt for Vision-Language Pre-Training

Jinpeng Wang ⋅ Pan Zhou ⋅ Mike Zheng Shou ⋅ Shuicheng Yan

Intrinsic Physical Concepts Discovery With Object-Centric Predictive Models

Qu Tang ⋅ Xiangyu Zhu ⋅ Zhen Lei ⋅ Zhaoxiang Zhang

MAP: Multimodal Uncertainty-Aware Vision-Language Pre-Training Model

Yatai Ji ⋅ Junjie Wang ⋅ Yuan Gong ⋅ Lin Zhang ⋅ Yanru Zhu ⋅ Hongfa Wang ⋅ Jiaxing Zhang ⋅ Tetsuya Sakai ⋅ Yujiu Yang

CLAMP: Prompt-Based Contrastive Learning for Connecting Language and Animal Pose

Xu Zhang ⋅ Wen Wang ⋅ Zhe Chen ⋅ Yufei Xu ⋅ Jing Zhang ⋅ Dacheng Tao

Teacher-Generated Spatial-Attention Labels Boost Robustness and Accuracy of Contrastive Models

Yushi Yao ⋅ Chang Ye ⋅ Junfeng He ⋅ Gamaleldin Elsayed

DegAE: A New Pretraining Paradigm for Low-Level Vision

Yihao Liu ⋅ Jingwen He ⋅ Jinjin Gu ⋅ Xiangtao Kong ⋅ Yu Qiao ⋅ Chao Dong

RILS: Masked Visual Reconstruction in Language Semantic Space

Shusheng Yang ⋅ Yixiao Ge ⋅ Kun Yi ⋅ Dian Li ⋅ Ying Shan ⋅ Xiaohu Qie ⋅ Xinggang Wang

Learning Geometry-Aware Representations by Sketching

Hyundo Lee ⋅ Inwoo Hwang ⋅ Hyunsung Go ⋅ Won-Seok Choi ⋅ Kibeom Kim ⋅ Byoung-Tak Zhang

SketchXAI: A First Look at Explainability for Human Sketches

Zhiyu Qu ⋅ Yulia Gryaditskaya ⋅ Ke Li ⋅ Kaiyue Pang ⋅ Tao Xiang ⋅ Yi-Zhe Song

MAGVLT: Masked Generative Vision-and-Language Transformer

Sungwoong Kim ⋅ Daejin Jo ⋅ Donghoon Lee ⋅ Jongmin Kim

Zero-Shot Everything Sketch-Based Image Retrieval, and in Explainable Style

Fengyin Lin ⋅ Mingkang Li ⋅ Da Li ⋅ Timothy Hospedales ⋅ Yi-Zhe Song ⋅ Yonggang Qi

Semantic-Conditional Diffusion Networks for Image Captioning

Jianjie Luo ⋅ Yehao Li ⋅ Yingwei Pan ⋅ Ting Yao ⋅ Jianlin Feng ⋅ Hongyang Chao ⋅ Tao Mei

REVEAL: Retrieval-Augmented Visual-Language Pre-Training With Multi-Source Multimodal Knowledge Memory

Ziniu Hu ⋅ Ahmet Iscen ⋅ Chen Sun ⋅ Zirui Wang ⋅ Kai-Wei Chang ⋅ Yizhou Sun ⋅ Cordelia Schmid ⋅ David A. Ross ⋅ Alireza Fathi

Variational Distribution Learning for Unsupervised Text-to-Image Generation

Minsoo Kang ⋅ Doyup Lee ⋅ Jiseob Kim ⋅ Saehoon Kim ⋅ Bohyung Han

Scaling Language-Image Pre-Training via Masking

Yanghao Li ⋅ Haoqi Fan ⋅ Ronghang Hu ⋅ Christoph Feichtenhofer ⋅ Kaiming He

LANIT: Language-Driven Image-to-Image Translation for Unlabeled Data

Jihye Park ⋅ Sunwoo Kim ⋅ Soohyun Kim ⋅ Seokju Cho ⋅ Jaejun Yoo ⋅ Youngjung Uh ⋅ Seungryong Kim

Revisiting Self-Similarity: Structural Embedding for Image Retrieval

Seongwon Lee ⋅ Suhyeon Lee ⋅ Hongje Seong ⋅ Euntai Kim

Improving Cross-Modal Retrieval With Set of Diverse Embeddings

Dongwon Kim ⋅ Namyup Kim ⋅ Suha Kwak

Masked Autoencoding Does Not Help Natural Language Supervision at Scale

Floris Weers ⋅ Vaishaal Shankar ⋅ Angelos Katharopoulos ⋅ Yinfei Yang ⋅ Tom Gunter

Few-Shot Learning With Visual Distribution Calibration and Cross-Modal Distribution Alignment

Runqi Wang ⋅ Hao Zheng ⋅ Xiaoyue Duan ⋅ Jianzhuang Liu ⋅ Yuning Lu ⋅ Tian Wang ⋅ Songcen Xu ⋅ Baochang Zhang

Deep Hashing With Minimal-Distance-Separated Hash Centers

Liangdao Wang ⋅ Yan Pan ⋅ Cong Liu ⋅ Hanjiang Lai ⋅ Jian Yin ⋅ Ye Liu

ConZIC: Controllable Zero-Shot Image Captioning by Sampling-Based Polishing

Zequn Zeng ⋅ Hao Zhang ⋅ Ruiying Lu ⋅ Dongsheng Wang ⋅ Bo Chen ⋅ Zhengjue Wang

Learning To Name Classes for Vision and Language Models

Sarah Parisot ⋅ Yongxin Yang ⋅ Steven McDonagh

Data-Efficient Large Scale Place Recognition With Graded Similarity Supervision

María Leyva-Vallina ⋅ Nicola Strisciuglio ⋅ Nicolai Petkov

DetCLIPv2: Scalable Open-Vocabulary Object Detection Pre-Training via Word-Region Alignment

Lewei Yao ⋅ Jianhua Han ⋅ Xiaodan Liang ⋅ Dan Xu ⋅ Wei Zhang ⋅ Zhenguo Li ⋅ Hang Xu

HOICLIP: Efficient Knowledge Transfer for HOI Detection With Vision-Language Models

Shan Ning ⋅ Longtian Qiu ⋅ Yongfei Liu ⋅ Xuming He

OvarNet: Towards Open-Vocabulary Object Attribute Recognition

Keyan Chen ⋅ Xiaolong Jiang ⋅ Yao Hu ⋅ Xu Tang ⋅ Yan Gao ⋅ Jianqi Chen ⋅ Weidi Xie

NeRF-RPN: A General Framework for Object Detection in NeRFs

Benran Hu ⋅ Junkai Huang ⋅ Yichen Liu ⋅ Yu-Wing Tai ⋅ Chi-Keung Tang

Mask-Free OVIS: Open-Vocabulary Instance Segmentation Without Manual Mask Annotations

Vibashan VS ⋅ Ning Yu ⋅ Chen Xing ⋅ Can Qin ⋅ Mingfei Gao ⋅ Juan Carlos Niebles ⋅ Vishal M. Patel ⋅ Ran Xu

GP-VTON: Towards General Purpose Virtual Try-On via Collaborative Local-Flow Global-Parsing Learning

Zhenyu Xie ⋅ Zaiyu Huang ⋅ Xin Dong ⋅ Fuwei Zhao ⋅ Haoye Dong ⋅ Xijin Zhang ⋅ Feida Zhu ⋅ Xiaodan Liang

Decomposed Soft Prompt Guided Fusion Enhancing for Compositional Zero-Shot Learning

Xiaocheng Lu ⋅ Song Guo ⋅ Ziming Liu ⋅ Jingcai Guo

Contrastive Grouping With Transformer for Referring Image Segmentation

Jiajin Tang ⋅ Ge Zheng ⋅ Cheng Shi ⋅ Sibei Yang

Semantic Prompt for Few-Shot Image Recognition

Wentao Chen ⋅ Chenyang Si ⋅ Zhang Zhang ⋅ Liang Wang ⋅ Zilei Wang ⋅ Tieniu Tan

GRES: Generalized Referring Expression Segmentation

Chang Liu ⋅ Henghui Ding ⋅ Xudong Jiang

Network-Free, Unsupervised Semantic Segmentation With Synthetic Images

Qianli Feng ⋅ Raghudeep Gadde ⋅ Wentong Liao ⋅ Eduard Ramon ⋅ Aleix Martinez

Few-Shot Semantic Image Synthesis With Class Affinity Transfer

Marlène Careil ⋅ Jakob Verbeek ⋅ Stéphane Lathuilière

Ultra-High Resolution Segmentation With Ultra-Rich Context: A Novel Benchmark

Deyi Ji ⋅ Feng Zhao ⋅ Hongtao Lu ⋅ Mingyuan Tao ⋅ Jieping Ye

Content-Aware Token Sharing for Efficient Semantic Segmentation With Vision Transformers

Chenyang Lu ⋅ Daan de Geus ⋅ Gijs Dubbelman

Hierarchical Dense Correlation Distillation for Few-Shot Segmentation

Bohao Peng ⋅ Zhuotao Tian ⋅ Xiaoyang Wu ⋅ Chengyao Wang ⋅ Shu Liu ⋅ Jingyong Su ⋅ Jiaya Jia

On Calibrating Semantic Segmentation Models: Analyses and an Algorithm

Dongdong Wang ⋅ Boqing Gong ⋅ Liqiang Wang

FastInst: A Simple Query-Based Model for Real-Time Instance Segmentation

Junjie He ⋅ Pengyu Li ⋅ Yifeng Geng ⋅ Xuansong Xie

Out-of-Candidate Rectification for Weakly Supervised Semantic Segmentation

Zesen Cheng ⋅ Pengchong Qiao ⋅ Kehan Li ⋅ Siheng Li ⋅ Pengxu Wei ⋅ Xiangyang Ji ⋅ Li Yuan ⋅ Chang Liu ⋅ Jie Chen

Foundation Model Drives Weakly Incremental Learning for Semantic Segmentation

Chaohui Yu ⋅ Qiang Zhou ⋅ Jingliang Li ⋅ Jianlong Yuan ⋅ Zhibin Wang ⋅ Fan Wang

Long-Tailed Visual Recognition via Self-Heterogeneous Integration With Knowledge Excavation

Yan Jin ⋅ Mengke Li ⋅ Yang Lu ⋅ Yiu-ming Cheung ⋅ Hanzi Wang

Instance-Specific and Model-Adaptive Supervision for Semi-Supervised Semantic Segmentation

Zhen Zhao ⋅ Sifan Long ⋅ Jimin Pi ⋅ Jingdong Wang ⋅ Luping Zhou

Active Finetuning: Exploiting Annotation Budget in the Pretraining-Finetuning Paradigm

Yichen Xie ⋅ Han Lu ⋅ Junchi Yan ⋅ Xiaokang Yang ⋅ Masayoshi Tomizuka ⋅ Wei Zhan

IDGI: A Framework To Eliminate Explanation Noise From Integrated Gradients

Ruo Yang ⋅ Binghui Wang ⋅ Mustafa Bilgic

Weakly Supervised Posture Mining for Fine-Grained Classification

Zhenchao Tang ⋅ Hualin Yang ⋅ Calvin Yu-Chian Chen

Vision Transformers Are Good Mask Auto-Labelers

Shiyi Lan ⋅ Xitong Yang ⋅ Zhiding Yu ⋅ Zuxuan Wu ⋅ Jose M. Alvarez ⋅ Anima Anandkumar

Enhanced Training of Query-Based Object Detection via Selective Query Recollection

Fangyi Chen ⋅ Han Zhang ⋅ Kai Hu ⋅ Yu-Kai Huang ⋅ Chenchen Zhu ⋅ Marios Savvides

Box-Level Active Detection

Mengyao Lyu ⋅ Jundong Zhou ⋅ Hui Chen ⋅ Yijie Huang ⋅ Dongdong Yu ⋅ Yaqian Li ⋅ Yandong Guo ⋅ Yuchen Guo ⋅ Liuyu Xiang ⋅ Guiguang Ding

CIGAR: Cross-Modality Graph Reasoning for Domain Adaptive Object Detection

Yabo Liu ⋅ Jinghua Wang ⋅ Chao Huang ⋅ Yaowei Wang ⋅ Yong Xu

DA-DETR: Domain Adaptive Detection Transformer With Information Fusion

Jingyi Zhang ⋅ Jiaxing Huang ⋅ Zhipeng Luo ⋅ Gongjie Zhang ⋅ Xiaoqin Zhang ⋅ Shijian Lu

Continual Detection Transformer for Incremental Object Detection

Yaoyao Liu ⋅ Bernt Schiele ⋅ Andrea Vedaldi ⋅ Christian Rupprecht

Semi-DETR: Semi-Supervised Object Detection With Detection Transformers

Jiacheng Zhang ⋅ Xiangru Lin ⋅ Wei Zhang ⋅ Kuo Wang ⋅ Xiao Tan ⋅ Junyu Han ⋅ Errui Ding ⋅ Jingdong Wang ⋅ Guanbin Li

Hierarchical Supervision and Shuffle Data Augmentation for 3D Semi-Supervised Object Detection

Chuandong Liu ⋅ Chenqiang Gao ⋅ Fangcen Liu ⋅ Pengcheng Li ⋅ Deyu Meng ⋅ Xinbo Gao

Harmonious Teacher for Cross-Domain Object Detection

Jinhong Deng ⋅ Dongli Xu ⋅ Wen Li ⋅ Lixin Duan

Contrastive Mean Teacher for Domain Adaptive Object Detectors

Shengcao Cao ⋅ Dhiraj Joshi ⋅ Liang-Yan Gui ⋅ Yu-Xiong Wang

Out-of-Distributed Semantic Pruning for Robust Semi-Supervised Learning

Yu Wang ⋅ Pengchong Qiao ⋅ Chang Liu ⋅ Guoli Song ⋅ Xiawu Zheng ⋅ Jie Chen

(ML)$^2$P-Encoder: On Exploration of Channel-Class Correlation for Multi-Label Zero-Shot Learning

Ziming Liu ⋅ Song Guo ⋅ Xiaocheng Lu ⋅ Jingcai Guo ⋅ Jiewei Zhang ⋅ Yue Zeng ⋅ Fushuo Huo

MagicNet: Semi-Supervised Multi-Organ Segmentation via Magic-Cube Partition and Recovery

Duowen Chen ⋅ Yunhao Bai ⋅ Wei Shen ⋅ Qingli Li ⋅ Lequan Yu ⋅ Yan Wang

Devil Is in the Queries: Advancing Mask Transformers for Real-World Medical Image Segmentation and Out-of-Distribution Localization

Mingze Yuan ⋅ Yingda Xia ⋅ Hexin Dong ⋅ Zifan Chen ⋅ Jiawen Yao ⋅ Mingyan Qiu ⋅ Ke Yan ⋅ Xiaoli Yin ⋅ Yu Shi ⋅ Xin Chen ⋅ Zaiyi Liu ⋅ Bin Dong ⋅ Jingren Zhou ⋅ Le Lu ⋅ Ling Zhang ⋅ Li Zhang

SQUID: Deep Feature In-Painting for Unsupervised Anomaly Detection

Tiange Xiang ⋅ Yixiao Zhang ⋅ Yongyi Lu ⋅ Alan L. Yuille ⋅ Chaoyi Zhang ⋅ Weidong Cai ⋅ Zongwei Zhou

OCELOT: Overlapped Cell on Tissue Dataset for Histopathology

Jeongun Ryu ⋅ Aaron Valero Puche ⋅ JaeWoong Shin ⋅ Seonwook Park ⋅ Biagio Brattoli ⋅ Jinhee Lee ⋅ Wonkyung Jung ⋅ Soo Ick Cho ⋅ Kyunghyun Paeng ⋅ Chan-Young Ock ⋅ Donggeun Yoo ⋅ Sérgio Pereira

DeGPR: Deep Guided Posterior Regularization for Multi-Class Cell Detection and Counting

Aayush Kumar Tyagi ⋅ Chirag Mohapatra ⋅ Prasenjit Das ⋅ Govind Makharia ⋅ Lalita Mehra ⋅ Prathosh AP ⋅ Mausam

Best of Both Worlds: Multimodal Contrastive Learning With Tabular and Imaging Data

Paul Hager ⋅ Martin J. Menten ⋅ Daniel Rueckert

RankMix: Data Augmentation for Weakly Supervised Learning of Classifying Whole Slide Images With Diverse Sizes and Imbalanced Categories

Yuan-Chih Chen ⋅ Chun-Shien Lu

GEN: Pushing the Limits of Softmax-Based Out-of-Distribution Detection

Xixi Liu ⋅ Yaroslava Lochman ⋅ Christopher Zach

Discriminating Known From Unknown Objects via Structure-Enhanced Recurrent Variational AutoEncoder

Aming Wu ⋅ Cheng Deng

Sample-Level Multi-View Graph Clustering

Yuze Tan ⋅ Yixi Liu ⋅ Shudong Huang ⋅ Wentao Feng ⋅ Jiancheng Lv

On the Effects of Self-Supervision and Contrastive Alignment in Deep Multi-View Clustering

Daniel J. Trosten ⋅ Sigurd Løkse ⋅ Robert Jenssen ⋅ Michael C. Kampffmeyer

Deep Fair Clustering via Maximizing and Minimizing Mutual Information: Theory, Algorithm and Metric

Pengxin Zeng ⋅ Yunfan Li ⋅ Peng Hu ⋅ Dezhong Peng ⋅ Jiancheng Lv ⋅ Xi Peng

Transductive Few-Shot Learning With Prototype-Based Label Propagation by Iterative Graph Refinement

Hao Zhu ⋅ Piotr Koniusz

Open-Set Likelihood Maximization for Few-Shot Learning

Malik Boudiaf ⋅ Etienne Bennequin ⋅ Myriam Tami ⋅ Antoine Toubhans ⋅ Pablo Piantanida ⋅ Celine Hudelot ⋅ Ismail Ben Ayed

HyperMatch: Noise-Tolerant Semi-Supervised Learning via Relaxed Contrastive Constraint

Beitong Zhou ⋅ Jing Lu ⋅ Kerui Liu ⋅ Yunlu Xu ⋅ Zhanzhan Cheng ⋅ Yi Niu

Token Boosting for Robust Self-Supervised Visual Transformer Pre-Training

Tianjiao Li ⋅ Lin Geng Foo ⋅ Ping Hu ⋅ Xindi Shang ⋅ Hossein Rahmani ⋅ Zehuan Yuan ⋅ Jun Liu

Difficulty-Based Sampling for Debiased Contrastive Representation Learning

Taeuk Jang ⋅ Xiaoqian Wang

Improving Selective Visual Question Answering by Learning From Your Peers

Corentin Dancette ⋅ Spencer Whitehead ⋅ Rishabh Maheshwary ⋅ Ramakrishna Vedantam ⋅ Stefan Scherer ⋅ Xinlei Chen ⋅ Matthieu Cord ⋅ Marcus Rohrbach

Superclass Learning With Representation Enhancement

Zeyu Gan ⋅ Suyun Zhao ⋅ Jinlong Kang ⋅ Liyuan Shang ⋅ Hong Chen ⋅ Cuiping Li

DISC: Learning From Noisy Labels via Dynamic Instance-Specific Selection and Correction

Yifan Li ⋅ Hu Han ⋅ Shiguang Shan ⋅ Xilin Chen

FCC: Feature Clusters Compression for Long-Tailed Visual Recognition

Jian Li ⋅ Ziyao Meng ⋅ Daqian Shi ⋅ Rui Song ⋅ Xiaolei Diao ⋅ Jingwen Wang ⋅ Hao Xu

Dynamically Instance-Guided Adaptation: A Backward-Free Approach for Test-Time Domain Adaptive Semantic Segmentation

Wei Wang ⋅ Zhun Zhong ⋅ Weijie Wang ⋅ Xi Chen ⋅ Charles Ling ⋅ Boyu Wang ⋅ Nicu Sebe

Semi-Supervised Domain Adaptation With Source Label Adaptation

Yu-Chu Yu ⋅ Hsuan-Tien Lin

Adjustment and Alignment for Unbiased Open Set Domain Adaptation

Wuyang Li ⋅ Jie Liu ⋅ Bo Han ⋅ Yixuan Yuan

C-SFDA: A Curriculum Learning Aided Self-Training Framework for Efficient Source Free Domain Adaptation

Nazmul Karim ⋅ Niluthpol Chowdhury Mithun ⋅ Abhinav Rajvanshi ⋅ Han-pang Chiu ⋅ Supun Samarasekera ⋅ Nazanin Rahnavard

ALOFT: A Lightweight MLP-Like Architecture With Dynamic Low-Frequency Transform for Domain Generalization

Jintao Guo ⋅ Na Wang ⋅ Lei Qi ⋅ Yinghuan Shi

Modality-Agnostic Debiasing for Single Domain Generalization

Sanqing Qu ⋅ Yingwei Pan ⋅ Guang Chen ⋅ Ting Yao ⋅ Changjun Jiang ⋅ Tao Mei

ActMAD: Activation Matching To Align Distributions for Test-Time-Training

Muhammad Jehanzeb Mirza ⋅ Pol Jané Soneira ⋅ Wei Lin ⋅ Mateusz Kozinski ⋅ Horst Possegger ⋅ Horst Bischof

TIPI: Test Time Adaptation With Transformation Invariance

A. Tuan Nguyen ⋅ Thanh Nguyen-Tang ⋅ Ser-Nam Lim ⋅ Philip H.S. Torr

Improved Test-Time Adaptation for Domain Generalization

Liang Chen ⋅ Yong Zhang ⋅ Yibing Song ⋅ Ying Shan ⋅ Lingqiao Liu

Learning With Fantasy: Semantic-Aware Virtual Contrastive Constraint for Few-Shot Class-Incremental Learning

Zeyin Song ⋅ Yifan Zhao ⋅ Yujun Shi ⋅ Peixi Peng ⋅ Li Yuan ⋅ Yonghong Tian

NIFF: Alleviating Forgetting in Generalized Few-Shot Object Detection via Neural Instance Feature Forging

Karim Guirguis ⋅ Johannes Meier ⋅ George Eskandar ⋅ Matthias Kayser ⋅ Bin Yang ⋅ Jürgen Beyerer

MixPHM: Redundancy-Aware Parameter-Efficient Tuning for Low-Resource Visual Question Answering

Jingjing Jiang ⋅ Nanning Zheng

PIVOT: Prompting for Video Continual Learning

Andrés Villa ⋅ Juan León Alcázar ⋅ Motasem Alfarra ⋅ Kumail Alhamoud ⋅ Julio Hurtado ⋅ Fabian Caba Heilbron ⋅ Alvaro Soto ⋅ Bernard Ghanem

BlackVIP: Black-Box Visual Prompting for Robust Transfer Learning

Changdae Oh ⋅ Hyeji Hwang ⋅ Hee-young Lee ⋅ YongTaek Lim ⋅ Geunyoung Jung ⋅ Jiyoung Jung ⋅ Hosik Choi ⋅ Kyungwoo Song

DKT: Diverse Knowledge Transfer Transformer for Class Incremental Learning

Xinyuan Gao ⋅ Yuhang He ⋅ Songlin Dong ⋅ Jie Cheng ⋅ Xing Wei ⋅ Yihong Gong

PCR: Proxy-Based Contrastive Replay for Online Class-Incremental Continual Learning

Huiwei Lin ⋅ Baoquan Zhang ⋅ Shanshan Feng ⋅ Xutao Li ⋅ Yunming Ye

Masked Autoencoders Enable Efficient Knowledge Distillers

Yutong Bai ⋅ Zeyu Wang ⋅ Junfei Xiao ⋅ Chen Wei ⋅ Huiyu Wang ⋅ Alan L. Yuille ⋅ Yuyin Zhou ⋅ Cihang Xie

Data-Free Knowledge Distillation via Feature Exchange and Activation Region Constraint

Shikang Yu ⋅ Jiachen Chen ⋅ Hu Han ⋅ Shuqiang Jiang

Multi-Level Logit Distillation

Ying Jin ⋅ Jiaqi Wang ⋅ Dahua Lin

Preserving Linear Separability in Continual Learning by Backward Feature Projection

Qiao Gu ⋅ Dongsub Shim ⋅ Florian Shkurti

Critical Learning Periods for Multisensory Integration in Deep Networks

Michael Kleinman ⋅ Alessandro Achille ⋅ Stefano Soatto

SLACK: Stable Learning of Augmentations With Cold-Start and KL Regularization

Juliette Marrie ⋅ Michael Arbel ⋅ Diane Larlus ⋅ Julien Mairal

Improving Generalization With Domain Convex Game

Fangrui Lv ⋅ Jian Liang ⋅ Shuang Li ⋅ Jinming Zhang ⋅ Di Liu

Exploring Data Geometry for Continual Learning

Zhi Gao ⋅ Chen Xu ⋅ Feng Li ⋅ Yunde Jia ⋅ Mehrtash Harandi ⋅ Yuwei Wu

FlowGrad: Controlling the Output of Generative ODEs With Gradients

Xingchao Liu ⋅ Lemeng Wu ⋅ Shujian Zhang ⋅ Chengyue Gong ⋅ Wei Ping ⋅ Qiang Liu

Deep Graph Reprogramming

Yongcheng Jing ⋅ Chongbin Yuan ⋅ Li Ju ⋅ Yiding Yang ⋅ Xinchao Wang ⋅ Dacheng Tao

X-Pruner: eXplainable Pruning for Vision Transformers

Lu Yu ⋅ Wei Xiang

Bias in Pruned Vision Models: In-Depth Analysis and Countermeasures

Eugenia Iofinova ⋅ Alexandra Peste ⋅ Dan Alistarh

Compacting Binary Neural Networks by Sparse Kernel Selection

Yikai Wang ⋅ Wenbing Huang ⋅ Yinpeng Dong ⋅ Fuchun Sun ⋅ Anbang Yao

Deep Deterministic Uncertainty: A New Simple Baseline

Jishnu Mukhoti ⋅ Andreas Kirsch ⋅ Joost van Amersfoort ⋅ Philip H.S. Torr ⋅ Yarin Gal

Understanding Deep Generative Models With Generalized Empirical Likelihoods

Suman Ravuri ⋅ Mélanie Rey ⋅ Shakir Mohamed ⋅ Marc Peter Deisenroth

Fair Scratch Tickets: Finding Fair Sparse Networks Without Weight Training

Pengwei Tang ⋅ Wei Yao ⋅ Zhicong Li ⋅ Yong Liu

Hard Sample Matters a Lot in Zero-Shot Quantization

Huantong Li ⋅ Xiangmiao Wu ⋅ Fanbing Lv ⋅ Daihai Liao ⋅ Thomas H. Li ⋅ Yonggang Zhang ⋅ Bo Han ⋅ Mingkui Tan

PD-Quant: Post-Training Quantization Based on Prediction Difference Metric

Jiawei Liu ⋅ Lin Niu ⋅ Zhihang Yuan ⋅ Dawei Yang ⋅ Xinggang Wang ⋅ Wenyu Liu

Vector Quantization With Self-Attention for Quality-Independent Representation Learning

Zhou Yang ⋅ Weisheng Dong ⋅ Xin Li ⋅ Mengluan Huang ⋅ Yulin Sun ⋅ Guangming Shi

Masked Auto-Encoders Meet Generative Adversarial Networks and Beyond

Zhengcong Fei ⋅ Mingyuan Fan ⋅ Li Zhu ⋅ Junshi Huang ⋅ Xiaoming Wei ⋅ Xiaolin Wei

Sequential Training of GANs Against GAN-Classifiers Reveals Correlated “Knowledge Gaps” Present Among Independently Trained GAN Instances

Arkanath Pathak ⋅ Nicholas Dufour

Edges to Shapes to Concepts: Adversarial Augmentation for Robust Vision

Aditay Tripathi ⋅ Rishubh Singh ⋅ Anirban Chakraborty ⋅ Pradeep Shenoy

Towards Universal Fake Image Detectors That Generalize Across Generative Models

Utkarsh Ojha ⋅ Yuheng Li ⋅ Yong Jae Lee

Explicit Boundary Guided Semi-Push-Pull Contrastive Learning for Supervised Anomaly Detection

Xincheng Yao ⋅ Ruoqi Li ⋅ Jing Zhang ⋅ Jun Sun ⋅ Chongyang Zhang

Generating Anomalies for Video Anomaly Detection With Prompt-Based Feature Mapping

Zuhao Liu ⋅ Xiao-Ming Wu ⋅ Dian Zheng ⋅ Kun-Yu Lin ⋅ Wei-Shi Zheng

Revisiting Reverse Distillation for Anomaly Detection

Tran Dinh Tien ⋅ Anh Tuan Nguyen ⋅ Nguyen Hoang Tran ⋅ Ta Duc Huy ⋅ Soan T.M. Duong ⋅ Chanh D. Tr. Nguyen ⋅ Steven Q. H. Truong

MetaMix: Towards Corruption-Robust Continual Learning With Temporally Self-Adaptive Data Transformation

Zhenyi Wang ⋅ Li Shen ⋅ Donglin Zhan ⋅ Qiuling Suo ⋅ Yanjun Zhu ⋅ Tiehang Duan ⋅ Mingchen Gao

ScaleFL: Resource-Adaptive Federated Learning With Heterogeneous Clients

Fatih Ilhan ⋅ Gong Su ⋅ Ling Liu

Confidence-Aware Personalized Federated Learning via Variational Expectation Maximization

Junyi Zhu ⋅ Xingchen Ma ⋅ Matthew B. Blaschko

Make Landscape Flatter in Differentially Private Federated Learning

Yifan Shi ⋅ Yingqi Liu ⋅ Kang Wei ⋅ Li Shen ⋅ Xueqian Wang ⋅ Dacheng Tao

Rethinking Domain Generalization for Face Anti-Spoofing: Separability and Alignment

Yiyou Sun ⋅ Yaojie Liu ⋅ Xiaoming Liu ⋅ Yixuan Li ⋅ Wen-Sheng Chu

StyleAdv: Meta Style Adversarial Training for Cross-Domain Few-Shot Learning

Yuqian Fu ⋅ Yu Xie ⋅ Yanwei Fu ⋅ Yu-Gang Jiang

The Dark Side of Dynamic Routing Neural Networks: Towards Efficiency Backdoor Injection

Simin Chen ⋅ Hanlin Chen ⋅ Mirazul Haque ⋅ Cong Liu ⋅ Wei Yang

Architectural Backdoors in Neural Networks

Mikel Bober-Irizar ⋅ Ilia Shumailov ⋅ Yiren Zhao ⋅ Robert Mullins ⋅ Nicolas Papernot

You Are Catching My Attention: Are Vision Transformers Bad Learners Under Backdoor Attacks?

Zenghui Yuan ⋅ Pan Zhou ⋅ Kai Zou ⋅ Yu Cheng

A Practical Upper Bound for the Worst-Case Attribution Deviations

Fan Wang ⋅ Adams Wai-Kin Kong

Sibling-Attack: Rethinking Transferable Adversarial Attacks Against Face Recognition

Zexin Li ⋅ Bangjie Yin ⋅ Taiping Yao ⋅ Junfeng Guo ⋅ Shouhong Ding ⋅ Simin Chen ⋅ Cong Liu

Angelic Patches for Improving Third-Party Object Detector Performance

Wenwen Si ⋅ Shuo Li ⋅ Sangdon Park ⋅ Insup Lee ⋅ Osbert Bastani

Introducing Competition To Boost the Transferability of Targeted Adversarial Examples Through Clean Feature Mixup

Junyoung Byun ⋅ Myung-Joon Kwon ⋅ Seungju Cho ⋅ Yoonji Kim ⋅ Changick Kim

Towards Compositional Adversarial Robustness: Generalizing Adversarial Training to Composite Semantic Perturbations

Lei Hsiung ⋅ Yun-Yun Tsai ⋅ Pin-Yu Chen ⋅ Tsung-Yi Ho

Boosting Accuracy and Robustness of Student Models via Adaptive Adversarial Distillation

Bo Huang ⋅ Mingyang Chen ⋅ Yi Wang ⋅ Junda Lu ⋅ Minhao Cheng ⋅ Wei Wang

The Enemy of My Enemy Is My Friend: Exploring Inverse Adversaries for Improving Adversarial Training

Junhao Dong ⋅ Seyed-Mohsen Moosavi-Dezfooli ⋅ Jianhuang Lai ⋅ Xiaohua Xie

Robust Single Image Reflection Removal Against Adversarial Attacks

Zhenbo Song ⋅ Zhenyuan Zhang ⋅ Kaihao Zhang ⋅ Wenhan Luo ⋅ Zhaoxin Fan ⋅ Wenqi Ren ⋅ Jianfeng Lu

Physical-World Optical Adversarial Attacks on 3D Face Recognition

Yanjie Li ⋅ Yiquan Li ⋅ Xuelong Dai ⋅ Songtao Guo ⋅ Bin Xiao

AUNet: Learning Relations Between Action Units for Face Forgery Detection

Weiming Bai ⋅ Yufan Liu ⋅ Zhipeng Zhang ⋅ Bing Li ⋅ Weiming Hu

Go to Event Page