CVPR 2023 Tuesday 06/20

Timezone: America/Vancouver

Full Schedule Sun 6/18 Mon 6/19 Tue 6/20 Wed 6/21 Thu 6/22

Remarks

Opening Ceremony

Greg Mori

8:30 AM - 9:00 AM

Invited Talk

Revisiting Old Ideas With Modern Hardware

Rodney Brooks

9:00 AM - 10:00 AM

Many computer vision ideas have been revisited again and again and again, including current modern computer vision based on neural computation. This round has led to incredible developments in computational hardware. Might such powerful computation breathe life into older neglected ideas?

... more

Speaker Bio

Rodney Brooks came to the US from Australia in 1977. His PhD (1981) work at the Stanford Artificial Intelligence Lab was in model based computer vision in the "hand-eye group". After post-docs at CMU and MIT he joined the faculty at Stanford for one year, then joined the MIT faculty in 1984. There he formed a robotics research group that developed mobile and humanoid robots, many of which were vision-based. In 1987 he and Takeo Kanade founded the International Journal of Computer Vision. He became director of the MIT Artificial Intelligence Lab in 1997 and in 2003 he became the founding director of MIT CSAIL (Computer Science and Artificial Intelligence Lab). Along the way he has founded six startups, including iRobot, Rethink Robotics, and now Robust AI, which is developing a vision based collaborative mobile robot for existing cluttered warehouses.

... more

Poster

Poster Session TUE-AM

10:30 AM - 12:00 PM

393 Events in this session

Megahertz Light Steering Without Moving Parts

Adithya Pediredla · Srinivasa G. Narasimhan · Maysamreza Chamanzar · Ioannis Gkioulekas

Robust Dynamic Radiance Fields

Yu-Lun Liu · Chen Gao · Andréas Meuleman · Hung-Yu Tseng · Ayush Saraf · Changil Kim · Yung-Yu Chuang · Johannes Kopf · Jia-Bin Huang

DBARF: Deep Bundle-Adjusting Generalizable Neural Radiance Fields

Yu Chen · Gim Hee Lee

VDN-NeRF: Resolving Shape-Radiance Ambiguity via View-Dependence Normalization

Bingfan Zhu · Yanchao Yang · Xulong Wang · Youyi Zheng · Leonidas Guibas

AligNeRF: High-Fidelity Neural Radiance Fields via Alignment-Aware Training

Yifan Jiang · Peter Hedman · Ben Mildenhall · Dejia Xu · Jonathan T. Barron · Zhangyang Wang · Tianfan Xue

SeaThru-NeRF: Neural Radiance Fields in Scattering Media

Deborah Levy · Amit Peleg · Naama Pearl · Dan Rosenbaum · Derya Akkaynak · Simon Korman · Tali Treibitz

Exact-NeRF: An Exploration of a Precise Volumetric Parameterization for Neural Radiance Fields

Brian K. S. Isaac-Medina · Chris G. Willcocks · Toby P. Breckon

Neural Residual Radiance Fields for Streamably Free-Viewpoint Videos

Liao Wang · Qiang Hu · Qihan He · Ziyu Wang · Jingyi Yu · Tinne Tuytelaars · Lan Xu · Minye Wu

PlenVDB: Memory Efficient VDB-Based Radiance Fields for Fast Training and Rendering

Han Yan · Celong Liu · Chao Ma · Xing Mei

Local Implicit Ray Function for Generalizable Radiance Field Representation

Xin Huang · Qi Zhang · Ying Feng · Xiaoyu Li · Xuan Wang · Qing Wang

SurfelNeRF: Neural Surfel Radiance Fields for Online Photorealistic Reconstruction of Indoor Scenes

Yiming Gao · Yan-Pei Cao · Ying Shan

Frequency-Modulated Point Cloud Rendering With Easy Editing

Yi Zhang · Xiaoyang Huang · Bingbing Ni · Teng Li · Wenjun Zhang

HexPlane: A Fast Representation for Dynamic Scenes

Ang Cao · Justin Johnson

Differentiable Shadow Mapping for Efficient Inverse Graphics

Markus Worchel · Marc Alexa

Hybrid Neural Rendering for Large-Scale Scenes With Motion Blur

Peng Dai · Yinda Zhang · Xin Yu · Xiaoyang Lyu · Xiaojuan Qi

TensoIR: Tensorial Inverse Rendering

Haian Jin · Isabella Liu · Peijia Xu · Xiaoshuai Zhang · Songfang Han · Sai Bi · Xiaowei Zhou · Zexiang Xu · Hao Su

ShadowNeuS: Neural SDF Reconstruction by Shadow Ray Supervision

Jingwang Ling · Zhibo Wang · Feng Xu

Realistic Saliency Guided Image Enhancement

S. Mahdi H. Miangoleh · Zoya Bylinskii · Eric Kee · Eli Shechtman · Yağiz Aksoy

LightPainter: Interactive Portrait Relighting With Freehand Scribble

Yiqun Mei · He Zhang · Xuaner Zhang · Jianming Zhang · Zhixin Shu · Yilin Wang · Zijun Wei · Shi Yan · HyunJoon Jung · Vishal M. Patel

A Unified Spatial-Angular Structured Light for Single-View Acquisition of Shape and Reflectance

Xianmin Xu · Yuxin Lin · Haoyang Zhou · Chong Zeng · Yaxin Yu · Kun Zhou · Hongzhi Wu

Learning Visibility Field for Detailed 3D Human Reconstruction and Relighting

Ruichen Zheng · Peng Li · Haoqian Wang · Tao Yu

Unsupervised Contour Tracking of Live Cells by Mechanical and Cycle Consistency Losses

Junbong Jang · Kwonmoo Lee · Tae-Kyun Kim

NeUDF: Leaning Neural Unsigned Distance Fields With Volume Rendering

Yu-Tao Liu · Li Wang · Jie Yang · Weikai Chen · Xiaoxu Meng · Bo Yang · Lin Gao

NeAT: Learning Neural Implicit Surfaces With Arbitrary Topologies From Multi-View Images

Xiaoxu Meng · Weikai Chen · Bo Yang

ALTO: Alternating Latent Topologies for Implicit 3D Reconstruction

Zhen Wang · Shijie Zhou · Jeong Joon Park · Despoina Paschalidou · Suya You · Gordon Wetzstein · Leonidas Guibas · Achuta Kadambi

Controllable Mesh Generation Through Sparse Latent Point Diffusion Models

Zhaoyang Lyu · Jinyi Wang · Yuwei An · Ya Zhang · Dahua Lin · Bo Dai

Power Bundle Adjustment for Large-Scale 3D Reconstruction

Simon Weber · Nikolaus Demmel · Tin Chon Chan · Daniel Cremers

Neural Pixel Composition for 3D-4D View Synthesis From Multi-Views

Aayush Bansal · Michael Zollhöfer

Magic3D: High-Resolution Text-to-3D Content Creation

Chen-Hsuan Lin · Jun Gao · Luming Tang · Towaki Takikawa · Xiaohui Zeng · Xun Huang · Karsten Kreis · Sanja Fidler · Ming-Yu Liu · Tsung-Yi Lin

3D Video Loops From Asynchronous Input

Li Ma · Xiaoyu Li · Jing Liao · Pedro V. Sander

High-Fidelity 3D GAN Inversion by Pseudo-Multi-View Optimization

Jiaxin Xie · Hao Ouyang · Jingtan Piao · Chenyang Lei · Qifeng Chen

Lift3D: Synthesize 3D Training Data by Lifting 2D GAN to 3D Generative Radiance Field

Leheng Li · Qing Lian · Luozhou Wang · Ningning Ma · Ying-Cong Chen

3D GAN Inversion With Facial Symmetry Prior

Fei Yin · Yong Zhang · Xuan Wang · Tengfei Wang · Xiaoyu Li · Yuan Gong · Yanbo Fan · Xiaodong Cun · Ying Shan · Cengiz Oztireli · Yujiu Yang

StyleIPSB: Identity-Preserving Semantic Basis of StyleGAN for High Fidelity Face Swapping

Diqiong Jiang · Dan Song · Ruofeng Tong · Min Tang

FFHQ-UV: Normalized Facial UV-Texture Dataset for 3D Face Reconstruction

Haoran Bai · Di Kang · Haoxian Zhang · Jinshan Pan · Linchao Bao

Robust Model-Based Face Reconstruction Through Weakly-Supervised Outlier Segmentation

Chunlu Li · Andreas Morel-Forster · Thomas Vetter · Bernhard Egger · Adam Kortylewski

Learning Neural Proto-Face Field for Disentangled 3D Face Modeling in the Wild

Zhenyu Zhang · Renwang Chen · Weijian Cao · Ying Tai · Chengjie Wang

A Hierarchical Representation Network for Accurate and Detailed Face Reconstruction From In-the-Wild Images

Biwen Lei · Jianqiang Ren · Mengyang Feng · Miaomiao Cui · Xuansong Xie

BlendFields: Few-Shot Example-Driven Facial Modeling

Kacper Kania · Stephan J. Garbin · Andrea Tagliasacchi · Virginia Estellers · Kwang Moo Yi · Julien Valentin · Tomasz Trzciński · Marek Kowalski

Implicit Neural Head Synthesis via Controllable Local Deformation Fields

Chuhan Chen · Matthew O’Toole · Gaurav Bharaj · Pablo Garrido

DPE: Disentanglement of Pose and Expression for General Video Portrait Editing

Youxin Pang · Yong Zhang · Weize Quan · Yanbo Fan · Xiaodong Cun · Ying Shan · Dong-Ming Yan

GANHead: Towards Generative Animatable Neural Head Avatars

Sijing Wu · Yichao Yan · Yunhao Li · Yuhao Cheng · Wenhan Zhu · Ke Gao · Xiaobo Li · Guangtao Zhai

EDGE: Editable Dance Generation From Music

Jonathan Tseng · Rodrigo Castellon · Karen Liu

Blowing in the Wind: CycleNet for Human Cinemagraphs From Still Images

Hugo Bertiche · Niloy J. Mitra · Kuldeep Kulkarni · Chun-Hao P. Huang · Tuanfeng Y. Wang · Meysam Madadi · Sergio Escalera · Duygu Ceylan

Generating Holistic 3D Human Motion From Speech

Hongwei Yi · Hualin Liang · Yifei Liu · Qiong Cao · Yandong Wen · Timo Bolkart · Dacheng Tao · Michael J. Black

Avatars Grow Legs: Generating Smooth Human Motion From Sparse Tracking Inputs With Diffusion Model

Yuming Du · Robin Kips · Albert Pumarola · Sebastian Starke · Ali Thabet · Artsiom Sanakoyeu

Learning Anchor Transformations for 3D Garment Animation

Fang Zhao · Zekun Li · Shaoli Huang · Junwu Weng · Tianfei Zhou · Guo-Sen Xie · Jue Wang · Ying Shan

CloSET: Modeling Clothed Humans on Continuous Surface With Explicit Template Decomposition

Hongwen Zhang · Siyou Lin · Ruizhi Shao · Yuxiang Zhang · Zerong Zheng · Han Huang · Yandong Guo · Yebin Liu

ECON: Explicit Clothed Humans Optimized via Normal Integration

Yuliang Xiu · Jinlong Yang · Xu Cao · Dimitrios Tzionas · Michael J. Black

PersonNeRF: Personalized Reconstruction From Photo Collections

Chung-Yi Weng · Pratul P. Srinivasan · Brian Curless · Ira Kemelmacher-Shlizerman

3D Human Mesh Estimation From Virtual Markers

Xiaoxuan Ma · Jiajun Su · Chunyu Wang · Wentao Zhu · Yizhou Wang

Overcoming the Trade-Off Between Accuracy and Plausibility in 3D Hand Shape Reconstruction

Ziwei Yu · Chen Li · Linlin Yang · Xiaoxu Zheng · Michael Bi Mi · Gim Hee Lee · Angela Yao

Recovering 3D Hand Mesh Sequence From a Single Blurry Image: A New Dataset and Temporal Unfolding

Yeonguk Oh · JoonKyu Park · Jaeha Kim · Gyeongsik Moon · Kyoung Mu Lee

MeMaHand: Exploiting Mesh-Mano Interaction for Single Image Two-Hand Reconstruction

Congyi Wang · Feida Zhu · Shilei Wen

PLIKS: A Pseudo-Linear Inverse Kinematic Solver for 3D Human Body Estimation

Karthik Shetty · Annette Birkhold · Srikrishna Jaganathan · Norbert Strobel · Markus Kowarschik · Andreas Maier · Bernhard Egger

CAMS: CAnonicalized Manipulation Spaces for Category-Level Functional Hand-Object Manipulation Synthesis

Juntian Zheng · Qingyuan Zheng · Lixing Fang · Yun Liu · Li Yi

Instant-NVR: Instant Neural Volumetric Rendering for Human-Object Interactions From Monocular RGBD Stream

Yuheng Jiang · Kaixin Yao · Zhuo Su · Zhehao Shen · Haimin Luo · Lan Xu

BundleSDF: Neural 6-DoF Tracking and 3D Reconstruction of Unknown Objects

Bowen Wen · Jonathan Tremblay · Valts Blukis · Stephen Tyree · Thomas Müller · Alex Evans · Dieter Fox · Jan Kautz · Stan Birchfield

Human-Art: A Versatile Human-Centric Dataset Bridging Natural and Artificial Scenes

Xuan Ju · Ailing Zeng · Jianan Wang · Qiang Xu · Lei Zhang

Omnimatte3D: Associating Objects and Their Effects in Unconstrained Monocular Video

Mohammed Suhail · Erika Lu · Zhengqi Li · Noah Snavely · Leonid Sigal · Forrester Cole

On the Benefits of 3D Pose and Tracking for Human Action Recognition

Jathushan Rajasegaran · Georgios Pavlakos · Angjoo Kanazawa · Christoph Feichtenhofer · Jitendra Malik

Towards Stable Human Pose Estimation via Cross-View Fusion and Foot Stabilization

Li’an Zhuo · Jian Cao · Qi Wang · Bang Zhang · Liefeng Bo

Human Pose As Compositional Tokens

Zigang Geng · Chunyu Wang · Yixuan Wei · Ze Liu · Houqiang Li · Han Hu

PoseExaminer: Automated Testing of Out-of-Distribution Robustness in Human Pose and Shape Estimation

Qihao Liu · Adam Kortylewski · Alan L. Yuille

SLOPER4D: A Scene-Aware Dataset for Global 4D Human Pose Estimation in Urban Environments

Yudi Dai · Yitai Lin · Xiping Lin · Chenglu Wen · Lan Xu · Hongwei Yi · Siqi Shen · Yuexin Ma · Cheng Wang

Semi-Supervised 2D Human Pose Estimation Driven by Position Inconsistency Pseudo Label Correction Module

Linzhi Huang · Yulong Li · Hongbo Tian · Yue Yang · Xiangang Li · Weihong Deng · Jieping Ye

Human Pose Estimation in Extremely Low-Light Conditions

Sohyun Lee · Jaesung Rim · Boseung Jeong · Geonu Kim · Byungju Woo · Haechan Lee · Sunghyun Cho · Suha Kwak

Flexible-Cm GAN: Towards Precise 3D Dose Prediction in Radiotherapy

Riqiang Gao · Bin Lou · Zhoubing Xu · Dorin Comaniciu · Ali Kamen

DualRefine: Self-Supervised Depth and Pose Estimation Through Iterative Epipolar Sampling and Refinement Toward Equilibrium

Antyanta Bangunharcana · Ahmed Magd · Kyung-Soo Kim

A Rotation-Translation-Decoupled Solution for Robust and Efficient Visual-Inertial Initialization

Yijia He · Bo Xu · Zhanpeng Ouyang · Hongdong Li

Semidefinite Relaxations for Robust Multiview Triangulation

Linus Härenstam-Nielsen · Niclas Zeller · Daniel Cremers

A Probabilistic Attention Model With Occlusion-Aware Texture Regression for 3D Hand Reconstruction From a Single RGB Image

Zheheng Jiang · Hossein Rahmani · Sue Black · Bryan M. Williams

Instant Multi-View Head Capture Through Learnable Registration

Timo Bolkart · Tianye Li · Michael J. Black

On the Importance of Accurate Geometry Data for Dense 3D Vision Tasks

HyunJun Jung · Patrick Ruhkamp · Guangyao Zhai · Nikolas Brasch · Yitong Li · Yannick Verdie · Jifei Song · Yiren Zhou · Anil Armagan · Slobodan Ilic · Aleš Leonardis · Nassir Navab · Benjamin Busam

Learning 3D Scene Priors With 2D Supervision

Yinyu Nie · Angela Dai · Xiaoguang Han · Matthias Nießner

OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation

Tong Wu · Jiarui Zhang · Xiao Fu · Yuxin Wang · Jiawei Ren · Liang Pan · Wayne Wu · Lei Yang · Jiaqi Wang · Chen Qian · Dahua Lin · Ziwei Liu

OpenScene: 3D Scene Understanding With Open Vocabularies

Songyou Peng · Kyle Genova · Chiyu “Max” Jiang · Andrea Tagliasacchi · Marc Pollefeys · Thomas Funkhouser

Multi-View Azimuth Stereo via Tangent Space Consistency

Xu Cao · Hiroaki Santo · Fumio Okura · Yasuyuki Matsushita

Progressive Transformation Learning for Leveraging Virtual Images in Training

Yi-Ting Shen · Hyungtae Lee · Heesung Kwon · Shuvra S. Bhattacharyya

Connecting the Dots: Floorplan Reconstruction Using Two-Level Queries

Yuanwen Yue · Theodora Kontogianni · Konrad Schindler · Francis Engelmann

NeRF-Supervised Deep Stereo

Fabio Tosi · Alessio Tonioni · Daniele De Gregorio · Matteo Poggi

Semantic Scene Completion With Cleaner Self

Fengyun Wang · Dong Zhang · Hanwang Zhang · Jinhui Tang · Qianru Sun

PanelNet: Understanding 360 Indoor Environment via Panel Representation

Haozheng Yu · Lu He · Bing Jian · Weiwei Feng · Shan Liu

Implicit View-Time Interpolation of Stereo Videos Using Multi-Plane Disparities and Non-Uniform Coordinates

Avinash Paliwal · Andrii Tsarov · Nima Khademi Kalantari

Depth Estimation From Indoor Panoramas With Neural Scene Representation

Wenjie Chang · Yueyi Zhang · Zhiwei Xiong

NeuralPCI: Spatio-Temporal Neural Field for 3D Point Cloud Multi-Frame Non-Linear Interpolation

Zehan Zheng · Danni Wu · Ruisi Lu · Fan Lu · Guang Chen · Changjun Jiang

RIAV-MVS: Recurrent-Indexing an Asymmetric Volume for Multi-View Stereo

Changjiang Cai · Pan Ji · Qingan Yan · Yi Xu

NeuMap: Neural Coordinate Mapping by Auto-Transdecoder for Camera Localization

Shitao Tang · Sicong Tang · Andrea Tagliasacchi · Ping Tan · Yasutaka Furukawa

MACARONS: Mapping and Coverage Anticipation With RGB Online Self-Supervision

Antoine Guédon · Tom Monnier · Pascal Monasse · Vincent Lepetit

vMAP: Vectorised Object Mapping for Neural Field SLAM

Xin Kong · Shikun Liu · Marwan Taher · Andrew J. Davison

Seeing a Rose in Five Thousand Ways

Yunzhi Zhang · Shangzhe Wu · Noah Snavely · Jiajun Wu

Propagate and Calibrate: Real-Time Passive Non-Line-of-Sight Tracking

Yihao Wang · Zhigang Wang · Bin Zhao · Dong Wang · Mulin Chen · Xuelong Li

Seeing With Sound: Long-range Acoustic Beamforming for Multimodal Scene Understanding

Praneeth Chakravarthula · Jim Aldon D’Souza · Ethan Tseng · Joe Bartusek · Felix Heide

Distilling Focal Knowledge From Imperfect Expert for 3D Object Detection

Jia Zeng · Li Chen · Hanming Deng · Lewei Lu · Junchi Yan · Yu Qiao · Hongyang Li

BEV-LaneDet: An Efficient 3D Lane Detection Based on Virtual Camera via Key-Points

Ruihao Wang · Jian Qin · Kaiying Li · Yaochen Li · Dong Cao · Jintao Xu

AShapeFormer: Semantics-Guided Object-Level Active Shape Encoding for 3D Object Detection via Transformers

Zechuan Li · Hongshan Yu · Zhengeng Yang · Tongjia Chen · Naveed Akhtar

Benchmarking Robustness of 3D Object Detection to Common Corruptions

Yinpeng Dong · Caixin Kang · Jinlai Zhang · Zijian Zhu · Yikai Wang · Xiao Yang · Hang Su · Xingxing Wei · Jun Zhu

Gaussian Label Distribution Learning for Spherical Image Object Detection

Hang Xu · Xinyuan Liu · Qiang Zhao · Yike Ma · Chenggang Yan · Feng Dai

Deep Depth Estimation From Thermal Image

Ukcheol Shin · Jinsun Park · In So Kweon

LidarGait: Benchmarking 3D Gait Recognition With Point Clouds

Chuanfu Shen · Chao Fan · Wei Wu · Rui Wang · George Q. Huang · Shiqi Yu

Generalized UAV Object Detection via Frequency Domain Disentanglement

Kunyu Wang · Xueyang Fu · Yukun Huang · Chengzhi Cao · Gege Shi · Zheng-Jun Zha

Learning Compact Representations for LiDAR Completion and Generation

Yuwen Xiong · Wei-Chiu Ma · Jingkang Wang · Raquel Urtasun

CXTrack: Improving 3D Point Cloud Tracking With Contextual Information

Tian-Xing Xu · Yuan-Chen Guo · Yu-Kun Lai · Song-Hai Zhang

Multispectral Video Semantic Segmentation: A Benchmark Dataset and Baseline

Wei Ji · Jingjing Li · Cheng Bian · Zongwei Zhou · Jiaying Zhao · Alan L. Yuille · Li Cheng

LinK: Linear Kernel for LiDAR-Based 3D Perception

Tao Lu · Xiang Ding · Haisong Liu · Gangshan Wu · Limin Wang

Point Cloud Forecasting as a Proxy for 4D Occupancy Forecasting

Tarasha Khurana · Peiyun Hu · David Held · Deva Ramanan

Curricular Object Manipulation in LiDAR-Based Object Detection

Ziyue Zhu · Qiang Meng · Xiao Wang · Ke Wang · Liujiang Yan · Jian Yang

Delivering Arbitrary-Modal Semantic Segmentation

Jiaming Zhang · Ruiping Liu · Hao Shi · Kailun Yang · Simon Reiß · Kunyu Peng · Haodong Fu · Kaiwei Wang · Rainer Stiefelhagen

Robust Outlier Rejection for 3D Registration With Variational Bayes

Haobo Jiang · Zheng Dang · Zhen Wei · Jin Xie · Jian Yang · Mathieu Salzmann

3D Human Keypoints Estimation From Point Clouds in the Wild Without Human Labels

Zhenzhen Weng · Alexander S. Gorban · Jingwei Ji · Mahyar Najibi · Yin Zhou · Dragomir Anguelov

Self-Supervised Pre-Training With Masked Shape Prediction for 3D Scene Understanding

Li Jiang · Zetong Yang · Shaoshuai Shi · Vladislav Golyanik · Dengxin Dai · Bernt Schiele

ULIP: Learning a Unified Representation of Language, Images, and Point Clouds for 3D Understanding

Le Xue · Mingfei Gao · Chen Xing · Roberto Martín-Martín · Jiajun Wu · Caiming Xiong · Ran Xu · Juan Carlos Niebles · Silvio Savarese

Open-Vocabulary Point-Cloud Object Detection Without 3D Annotation

Yuheng Lu · Chenfeng Xu · Xiaobao Wei · Xiaodong Xie · Masayoshi Tomizuka · Kurt Keutzer · Shanghang Zhang

FlatFormer: Flattened Window Attention for Efficient Point Cloud Transformer

Zhijian Liu · Xinyu Yang · Haotian Tang · Shang Yang · Song Han

PointCMP: Contrastive Mask Prediction for Self-Supervised Learning on Point Cloud Videos

Zhiqiang Shen · Xiaoxiao Sheng · Longguang Wang · Yulan Guo · Qiong Liu · Xi Zhou

E2PN: Efficient SE(3)-Equivariant Point Network

Minghan Zhu · Maani Ghaffari · William A. Clark · Huei Peng

Poly-PC: A Polyhedral Network for Multiple Point Cloud Tasks at Once

Tao Xie · Shiguang Wang · Ke Wang · Linqi Yang · Zhiqiang Jiang · Xingcheng Zhang · Kun Dai · Ruifeng Li · Jian Cheng

Improving Graph Representation for Point Cloud Segmentation via Attentive Filtering

Nan Zhang · Zhiyi Pan · Thomas H. Li · Wei Gao · Ge Li

BUFFER: Balancing Accuracy, Efficiency, and Generalizability in Point Cloud Registration

Sheng Ao · Qingyong Hu · Hanyun Wang · Kai Xu · Yulan Guo

TopDiG: Class-Agnostic Topological Directional Graph Extraction From Remote Sensing Images

Bingnan Yang · Mi Zhang · Zhan Zhang · Zhili Zhang · Xiangyun Hu

Recognizing Rigid Patterns of Unlabeled Point Clouds by Complete and Continuous Isometry Invariants With No False Negatives and No False Positives

Daniel Widdowson · Vitaliy Kurlin

Both Style and Distortion Matter: Dual-Path Unsupervised Domain Adaptation for Panoramic Semantic Segmentation

Xu Zheng · Jinjing Zhu · Yexin Liu · Zidong Cao · Chong Fu · Lin Wang

CCuantuMM: Cycle-Consistent Quantum-Hybrid Matching of Multiple Shapes

Harshil Bhatia · Edith Tretschk · Zorah Lähner · Marcel Seelbach Benkner · Michael Moeller · Christian Theobalt · Vladislav Golyanik

Enhancing Deformable Local Features by Jointly Learning To Detect and Describe Keypoints

Guilherme Potje · Felipe Cadar · André Araujo · Renato Martins · Erickson R. Nascimento

Understanding and Improving Features Learned in Deep Functional Maps

Souhaib Attaiki · Maks Ovsjanikov

High-Frequency Stereo Matching Network

Haoliang Zhao · Huizhou Zhou · Yongjun Zhang · Jie Chen · Yitong Yang · Yong Zhao

Rethinking Optical Flow From Geometric Matching Consistent Perspective

Qiaole Dong · Chenjie Cao · Yanwei Fu

Efficient Robust Principal Component Analysis via Block Krylov Iteration and CUR Decomposition

Shun Fang · Zhengqin Xu · Shiqian Wu · Shoulie Xie

VectorFloorSeg: Two-Stream Graph Attention Network for Vectorized Roughcast Floorplan Segmentation

Bingchen Yang · Haiyong Jiang · Hao Pan · Jun Xiao

TBP-Former: Learning Temporal Bird’s-Eye-View Pyramid for Joint Perception and Prediction in Vision-Centric Autonomous Driving

Shaoheng Fang · Zi Wang · Yiqi Zhong · Junhao Ge · Siheng Chen

Implicit Occupancy Flow Fields for Perception and Prediction in Self-Driving

Ben Agro · Quinlan Sykora · Sergio Casas · Raquel Urtasun

UniSim: A Neural Closed-Loop Sensor Simulator

Ze Yang · Yun Chen · Jingkang Wang · Sivabalan Manivasagam · Wei-Chiu Ma · Anqi Joyce Yang · Raquel Urtasun

FEND: A Future Enhanced Distribution-Aware Contrastive Learning Framework for Long-Tail Trajectory Prediction

Yuning Wang · Pu Zhang · Lei Bai · Jianru Xue

EqMotion: Equivariant Multi-Agent Motion Prediction With Invariant Interaction Reasoning

Chenxin Xu · Robby T. Tan · Yuhong Tan · Siheng Chen · Yu Guang Wang · Xinchao Wang · Yanfeng Wang

Lookahead Diffusion Probabilistic Models for Refining Mean Estimation

Guoqiang Zhang · Kenta Niwa · W. Bastiaan Kleijn

Neural Volumetric Memory for Visual Locomotion Control

Ruihan Yang · Ge Yang · Xiaolong Wang

Gazeformer: Scalable, Effective and Fast Prediction of Goal-Directed Human Attention

Sounak Mondal · Zhibo Yang · Seoyoung Ahn · Dimitris Samaras · Gregory Zelinsky · Minh Hoai

DrapeNet: Garment Generation and Self-Supervised Draping

Luca De Luigi · Ren Li · Benoît Guillard · Mathieu Salzmann · Pascal Fua

Tracking Multiple Deformable Objects in Egocentric Videos

Mingzhen Huang · Xiaoxing Li · Jun Hu · Honghong Peng · Siwei Lyu

Good Is Bad: Causality Inspired Cloth-Debiasing for Cloth-Changing Person Re-Identification

Zhengwei Yang · Meng Lin · Xian Zhong · Yu Wu · Zheng Wang

Micron-BERT: BERT-Based Facial Micro-Expression Recognition

Xuan-Bac Nguyen · Chi Nhan Duong · Xin Li · Susan Gauch · Han-Seok Seo · Khoa Luu

MARLIN: Masked Autoencoder for Facial Video Representation LearnINg

Zhixi Cai · Shreya Ghosh · Kalin Stefanov · Abhinav Dhall · Jianfei Cai · Hamid Rezatofighi · Reza Haffari · Munawar Hayat

StyleSync: High-Fidelity Generalized and Personalized Lip Sync in Style-Based Generator

Jiazhi Guan · Zhanwang Zhang · Hang Zhou · Tianshu Hu · Kaisiyuan Wang · Dongliang He · Haocheng Feng · Jingtuo Liu · Errui Ding · Ziwei Liu · Jingdong Wang

RealImpact: A Dataset of Impact Sound Fields for Real Objects

Samuel Clarke · Ruohan Gao · Mason Wang · Mark Rau · Julia Xu · Jui-Hsien Wang · Doug L. James · Jiajun Wu

STMT: A Spatial-Temporal Mesh Transformer for MoCap-Based Action Recognition

Xiaoyu Zhu · Po-Yao Huang · Junwei Liang · Celso M. de Melo · Alexander G. Hauptmann

Progressive Spatio-Temporal Alignment for Efficient Event-Based Motion Estimation

Xueyan Huang · Yueyi Zhang · Zhiwei Xiong

Event-Based Shape From Polarization

Manasi Muglikar · Leonard Bauersfeld · Diederik Paul Moeys · Davide Scaramuzza

Learning Spatial-Temporal Implicit Neural Representations for Event-Guided Video Super-Resolution

Yunfan Lu · Zipeng Wang · Minjie Liu · Hongjian Wang · Lin Wang

BiFormer: Learning Bilateral Motion Estimation via Bilateral Transformer for 4K Video Frame Interpolation

Junheum Park · Jintae Kim · Chang-Su Kim

A Unified Pyramid Recurrent Network for Video Frame Interpolation

Xin Jin · Longhai Wu · Jie Chen · Youxin Chen · Jayoon Koo · Cheul-hee Hahm

Event-Based Blurry Frame Interpolation Under Blind Exposure

Wenming Weng · Yueyi Zhang · Zhiwei Xiong

FlowFormer++: Masked Cost Volume Autoencoding for Pretraining Optical Flow Estimation

Xiaoyu Shi · Zhaoyang Huang · Dasong Li · Manyuan Zhang · Ka Chun Cheung · Simon See · Hongwei Qin · Jifeng Dai · Hongsheng Li

POTTER: Pooling Attention Transformer for Efficient Human Mesh Recovery

Ce Zheng · Xianpeng Liu · Guo-Jun Qi · Chen Chen

Adaptive Patch Deformation for Textureless-Resilient Multi-View Stereo

Yuesong Wang · Zhaojie Zeng · Tao Guan · Wei Yang · Zhuo Chen · Wenkai Liu · Luoyuan Xu · Yawei Luo

On the Difficulty of Unpaired Infrared-to-Visible Video Translation: Fine-Grained Content-Rich Patches Transfer

Zhenjie Yu · Shuang Li · Yirui Shen · Chi Harold Liu · Shuigen Wang

Thermal Spread Functions (TSF): Physics-Guided Material Classification

Aniket Dashpute · Vishwanath Saragadam · Emma Alexander · Florian Willomitzer · Aggelos Katsaggelos · Ashok Veeraraghavan · Oliver Cossairt

Better “CMOS” Produces Clearer Images: Learning Space-Variant Blur Estimation for Blind Image Super-Resolution

Xuhai Chen · Jiangning Zhang · Chao Xu · Yabiao Wang · Chengjie Wang · Yong Liu

Learning Semantic-Aware Knowledge Guidance for Low-Light Image Enhancement

Yuhui Wu · Chen Pan · Guoqing Wang · Yang Yang · Jiwei Wei · Chongyi Li · Heng Tao Shen

CutMIB: Boosting Light Field Super-Resolution via Multi-View Image Blending

Zeyu Xiao · Yutong Liu · Ruisheng Gao · Zhiwei Xiong

sRGB Real Noise Synthesizing With Neighboring Correlation-Aware Noise Model

Zixuan Fu · Lanqing Guo · Bihan Wen

Masked Image Training for Generalizable Deep Image Denoising

Haoyu Chen · Jinjin Gu · Yihao Liu · Salma Abdel Magid · Chao Dong · Qiong Wang · Hanspeter Pfister · Lei Zhu

DR2: Diffusion-Based Robust Degradation Remover for Blind Face Restoration

Zhixin Wang · Ziying Zhang · Xiaoyun Zhang · Huangjie Zheng · Mingyuan Zhou · Ya Zhang · Yanfeng Wang

Learning Distortion Invariant Representation for Image Restoration From a Causality Perspective

Xin Li · Bingchen Li · Xin Jin · Cuiling Lan · Zhibo Chen

Perception-Oriented Single Image Super-Resolution Using Optimal Objective Estimation

Seung Ho Park · Young Su Moon · Nam Ik Cho

Catch Missing Details: Image Reconstruction With Frequency Augmented Variational Autoencoder

Xinmiao Lin · Yikang Li · Jenhao Hsiao · Chiuman Ho · Yu Kong

MD-VQA: Multi-Dimensional Quality Assessment for UGC Live Videos

Zicheng Zhang · Wei Wu · Wei Sun · Danyang Tu · Wei Lu · Xiongkuo Min · Ying Chen · Guangtao Zhai

CABM: Content-Aware Bit Mapping for Single Image Super-Resolution Network With Large Input

Senmao Tian · Ming Lu · Jiaming Liu · Yandong Guo · Yurong Chen · Shunli Zhang

Initialization Noise in Image Gradients and Saliency Maps

Ann-Christin Woerl · Jan Disselhoff · Michael Wand

Local Implicit Normalizing Flow for Arbitrary-Scale Image Super-Resolution

Jie-En Yao · Li-Yuan Tsao · Yi-Chen Lo · Roy Tseng · Chia-Che Chang · Chun-Yi Lee

Deep Arbitrary-Scale Image Super-Resolution via Scale-Equivariance Pursuit

Xiaohang Wang · Xuanhong Chen · Bingbing Ni · Hang Wang · Zhengyan Tong · Yutian Liu

CiaoSR: Continuous Implicit Attention-in-Attention Network for Arbitrary-Scale Image Super-Resolution

Jiezhang Cao · Qin Wang · Yongqin Xian · Yawei Li · Bingbing Ni · Zhiming Pi · Kai Zhang · Yulun Zhang · Radu Timofte · Luc Van Gool

Multiplicative Fourier Level of Detail

Yishun Dou · Zhong Zheng · Qiaoqiao Jin · Bingbing Ni

Document Image Shadow Removal Guided by Color-Aware Background

Ling Zhang · Yinghao He · Qing Zhang · Zheng Liu · Xiaolong Zhang · Chunxia Xiao

StyleRes: Transforming the Residuals for Real Image Editing With StyleGAN

Hamza Pehlivan · Yusuf Dalva · Aysegul Dundar

TopNet: Transformer-Based Object Placement Network for Image Compositing

Sijie Zhu · Zhe Lin · Scott Cohen · Jason Kuen · Zhifei Zhang · Chen Chen

VecFontSDF: Learning To Reconstruct and Synthesize High-Quality Vector Fonts via Signed Distance Functions

Zeqing Xia · Bojun Xiong · Zhouhui Lian

CF-Font: Content Fusion for Few-Shot Font Generation

Chi Wang · Min Zhou · Tiezheng Ge · Yuning Jiang · Hujun Bao · Weiwei Xu

SIEDOB: Semantic Image Editing by Disentangling Object and Background

Wuyang Luo · Su Yang · Xinjian Zhang · Weishan Zhang

MaskSketch: Unpaired Structure-Guided Masked Image Generation

Dina Bashkirova · José Lezama · Kihyuk Sohn · Kate Saenko · Irfan Essa

Text2Scene: Text-Driven Indoor Scene Stylization With Part-Aware Details

Inwoo Hwang · Hyeonwoo Kim · Young Min Kim

Uncovering the Disentanglement Capability in Text-to-Image Diffusion Models

Qiucheng Wu · Yujian Liu · Handong Zhao · Ajinkya Kale · Trung Bui · Tong Yu · Zhe Lin · Yang Zhang · Shiyu Chang

VectorFusion: Text-to-SVG by Abstracting Pixel-Based Diffusion Models

Ajay Jain · Amber Xie · Pieter Abbeel

Plug-and-Play Diffusion Features for Text-Driven Image-to-Image Translation

Narek Tumanyan · Michal Geyer · Shai Bagon · Tali Dekel

Multi-Concept Customization of Text-to-Image Diffusion

Nupur Kumari · Bingliang Zhang · Richard Zhang · Eli Shechtman · Jun-Yan Zhu

Unifying Layout Generation With a Decoupled Diffusion Model

Mude Hui · Zhizheng Zhang · Xiaoyi Zhang · Wenxuan Xie · Yuwang Wang · Yan Lu

BBDM: Image-to-Image Translation With Brownian Bridge Diffusion Models

Bo Li · Kaitao Xue · Bin Liu · Yu-Kun Lai

Towards Practical Plug-and-Play Diffusion Models

Hyojun Go · Yunsung Lee · Jin-Young Kim · Seunghyun Lee · Myeongho Jeong · Hyun Seung Lee · Seungtaek Choi

Post-Training Quantization on Diffusion Models

Yuzhang Shang · Zhihang Yuan · Bin Xie · Bingzhe Wu · Yan Yan

DiffTalk: Crafting Diffusion Models for Generalized Audio-Driven Portraits Animation

Shuai Shen · Wenliang Zhao · Zibin Meng · Wanhua Li · Zheng Zhu · Jie Zhou · Jiwen Lu

Mask-Guided Matting in the Wild

Kwanyong Park · Sanghyun Woo · Seoung Wug Oh · In So Kweon · Joon-Young Lee

Not All Image Regions Matter: Masked Vector Quantization for Autoregressive Image Generation

Mengqi Huang · Zhendong Mao · Quan Wang · Yongdong Zhang

Compression-Aware Video Super-Resolution

Yingwei Wang · Takashi Isobe · Xu Jia · Xin Tao · Huchuan Lu · Yu-Wing Tai

Neural Rate Estimator and Unsupervised Learning for Efficient Distributed Image Analytics in Split-DNN Models

Nilesh Ahuja · Parual Datta · Bhavya Kanzariya · V. Srinivasa Somayazulu · Omesh Tickoo

DNeRV: Modeling Inherent Dynamics via Difference Neural Representation for Videos

Qi Zhao · M. Salman Asif · Zhan Ma

Polynomial Implicit Neural Representations for Large Diverse Datasets

Rajhans Singh · Ankita Shukla · Pavan Turaga

Learning Decorrelated Representations Efficiently Using Fast Fourier Transform

Yutaro Shigeto · Masashi Shimbo · Yuya Yoshikawa · Akikazu Takeuchi

SparseViT: Revisiting Activation Sparsity for Efficient High-Resolution Vision Transformer

Xuanyao Chen · Zhijian Liu · Haotian Tang · Li Yi · Hang Zhao · Song Han

N-Gram in Swin Transformers for Efficient Lightweight Image Super-Resolution

Haram Choi · Jeongmin Lee · Jihoon Yang

Slide-Transformer: Hierarchical Vision Transformer With Local Self-Attention

Xuran Pan · Tianzhu Ye · Zhuofan Xia · Shiji Song · Gao Huang

Joint Token Pruning and Squeezing Towards More Aggressive Compression of Vision Transformers

Siyuan Wei · Tianzhu Ye · Shen Zhang · Yao Tang · Jiajun Liang

Top-Down Visual Attention From Analysis by Synthesis

Baifeng Shi · Trevor Darrell · Xin Wang

Probing Neural Representations of Scene Perception in a Hippocampally Dependent Task Using Artificial Neural Networks

Markus Frey · Christian F. Doeller · Caswell Barry

Masked Image Modeling With Local Multi-Scale Reconstruction

Haoqing Wang · Yehui Tang · Yunhe Wang · Jianyuan Guo · Zhi-Hong Deng · Kai Han

Siamese Image Modeling for Self-Supervised Vision Representation Learning

Chenxin Tao · Xizhou Zhu · Weijie Su · Gao Huang · Bin Li · Jie Zhou · Yu Qiao · Xiaogang Wang · Jifeng Dai

MAGE: MAsked Generative Encoder To Unify Representation Learning and Image Synthesis

Tianhong Li · Huiwen Chang · Shlok Mishra · Han Zhang · Dina Katabi · Dilip Krishnan

Diverse Embedding Expansion Network and Low-Light Cross-Modality Benchmark for Visible-Infrared Person Re-Identification

Yukang Zhang · Hanzi Wang

DistilPose: Tokenized Pose Regression With Heatmap Distillation

Suhang Ye · Yingyi Zhang · Jie Hu · Liujuan Cao · Shengchuan Zhang · Lei Shen · Jun Wang · Shouhong Ding · Rongrong Ji

Graph Transformer GANs for Graph-Constrained House Generation

Hao Tang · Zhenyu Zhang · Humphrey Shi · Bo Li · Ling Shao · Nicu Sebe · Radu Timofte · Luc Van Gool

Automatic High Resolution Wire Segmentation and Removal

Mang Tik Chiu · Xuaner Zhang · Zijun Wei · Yuqian Zhou · Eli Shechtman · Connelly Barnes · Zhe Lin · Florian Kainz · Sohrab Amirghodsi · Humphrey Shi

Tree Instance Segmentation With Temporal Contour Graph

Adnan Firoze · Cameron Wingren · Raymond A. Yeh · Bedrich Benes · Daniel Aliaga

Dual-Path Adaptation From Image to Video Transformers

Jungin Park · Jiyoung Lee · Kwanghoon Sohn

Rethinking Video ViTs: Sparse Video Tubes for Joint Image and Video Learning

AJ Piergiovanni · Weicheng Kuo · Anelia Angelova

Modeling Video As Stochastic Processes for Fine-Grained Video Representation Learning

Heng Zhang · Daqing Liu · Qi Zheng · Bing Su

Masked Motion Encoding for Self-Supervised Video Representation Learning

Xinyu Sun · Peihao Chen · Liangwei Chen · Changhao Li · Thomas H. Li · Mingkui Tan · Chuang Gan

Boosting Video Object Segmentation via Space-Time Correspondence Learning

Yurong Zhang · Liulei Li · Wenguan Wang · Rong Xie · Li Song · Wenjun Zhang

Two-Shot Video Object Segmentation

Kun Yan · Xiao Li · Fangyun Wei · Jinglu Wang · Chenbin Zhang · Ping Wang · Yan Lu

Look Before You Match: Instance Understanding Matters in Video Object Segmentation

Junke Wang · Dongdong Chen · Zuxuan Wu · Chong Luo · Chuanxin Tang · Xiyang Dai · Yucheng Zhao · Yujia Xie · Lu Yuan · Yu-Gang Jiang

Spatial-Then-Temporal Self-Supervised Learning for Video Correspondence

Rui Li · Dong Liu

Few-Shot Referring Relationships in Videos

Yogesh Kumar · Anand Mishra

Vision Transformers Are Parameter-Efficient Audio-Visual Learners

Yan-Bo Lin · Yi-Lin Sung · Jie Lei · Mohit Bansal · Gedas Bertasius

Egocentric Video Task Translation

Zihui Xue · Yale Song · Kristen Grauman · Lorenzo Torresani

QPGesture: Quantization-Based and Phase-Guided Motion Matching for Natural Speech-Driven Gesture Generation

Sicheng Yang · Zhiyong Wu · Minglei Li · Zhensong Zhang · Lei Hao · Weihong Bao · Haolin Zhuang

Co-Speech Gesture Synthesis by Reinforcement Learning With Contrastive Pre-Trained Rewards

Mingyang Sun · Mengchen Zhao · Yaqing Hou · Minglei Li · Huang Xu · Songcen Xu · Jianye Hao

TimeBalance: Temporally-Invariant and Temporally-Distinctive Video Representations for Semi-Supervised Action Recognition

Ishan Rajendrakumar Dave · Mamshad Nayeem Rizve · Chen Chen · Mubarak Shah

How Can Objects Help Action Recognition?

Xingyi Zhou · Anurag Arnab · Chen Sun · Cordelia Schmid

Actionlet-Dependent Contrastive Learning for Unsupervised Skeleton-Based Action Recognition

Lilang Lin · Jiahang Zhang · Jiaying Liu

Decomposed Cross-Modal Distillation for RGB-Based Temporal Action Detection

Pilhyeon Lee · Taeoh Kim · Minho Shim · Dongyoon Wee · Hyeran Byun

ASPnet: Action Segmentation With Shared-Private Representation of Multiple Data Sources

Beatrice van Amsterdam · Abdolrahim Kadkhodamohammadi · Imanol Luengo · Danail Stoyanov

Proposal-Based Multiple Instance Learning for Weakly-Supervised Temporal Action Localization

Huan Ren · Wenfei Yang · Tianzhu Zhang · Yongdong Zhang

LOGO: A Long-Form Video Dataset for Group Action Quality Assessment

Shiyi Zhang · Wenxun Dai · Sujia Wang · Xiangwei Shen · Jiwen Lu · Jie Zhou · Yansong Tang

Use Your Head: Improving Long-Tail Video Recognition

Toby Perrett · Saptarshi Sinha · Tilo Burghardt · Majid Mirmehdi · Dima Damen

Conditional Generation of Audio From Video via Foley Analogies

Yuexi Du · Ziyang Chen · Justin Salamon · Bryan Russell · Andrew Owens

Weakly Supervised Video Representation Learning With Unaligned Text for Sequential Videos

Sixun Dong · Huazhang Hu · Dongze Lian · Weixin Luo · Yicheng Qian · Shenghua Gao

You Can Ground Earlier Than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos

Xiang Fang · Daizong Liu · Pan Zhou · Guoshun Nan

Connecting Vision and Language With Video Localized Narratives

Paul Voigtlaender · Soravit Changpinyo · Jordi Pont-Tuset · Radu Soricut · Vittorio Ferrari

Video-Text As Game Players: Hierarchical Banzhaf Interaction for Cross-Modal Representation Learning

Peng Jin · Jinfa Huang · Pengfei Xiong · Shangxuan Tian · Chang Liu · Xiangyang Ji · Li Yuan · Jie Chen

Aligning Step-by-Step Instructional Diagrams to Video Demonstrations

Jiahao Zhang · Anoop Cherian · Yanbin Liu · Yizhak Ben-Shabat · Cristian Rodriguez · Stephen Gould

Make-a-Story: Visual Memory Conditioned Consistent Story Generation

Tanzila Rahman · Hsin-Ying Lee · Jian Ren · Sergey Tulyakov · Shweta Mahajan · Leonid Sigal

Test of Time: Instilling Video-Language Models With a Sense of Time

Piyush Bagad · Makarand Tapaswi · Cees G. M. Snoek

How You Feelin’? Learning Emotions and Mental States in Movie Scenes

Dhruv Srivastava · Aditya Kumar Singh · Makarand Tapaswi

Continuous Sign Language Recognition With Correlation Network

Lianyu Hu · Liqing Gao · Zekang Liu · Wei Feng

DIP: Dual Incongruity Perceiving Network for Sarcasm Detection

Changsong Wen · Guoli Jia · Jufeng Yang

Gloss Attention for Gloss-Free Sign Language Translation

Aoxiong Yin · Tianyun Zhong · Li Tang · Weike Jin · Tao Jin · Zhou Zhao

Object-Goal Visual Navigation via Effective Exploration of Relations Among Historical Navigation States

Heming Du · Lincheng Li · Zi Huang · Xin Yu

Behavioral Analysis of Vision-and-Language Navigation Agents

Zijiao Yang · Arjun Majumdar · Stefan Lee

KERM: Knowledge Enhanced Reasoning for Vision-and-Language Navigation

Xiangyang Li · Zihan Wang · Jiahao Yang · Yaowei Wang · Shuqiang Jiang

Where Is My Wallet? Modeling Object Proposal Sets for Egocentric Visual Query Localization

Mengmeng Xu · Yanghao Li · Cheng-Yang Fu · Bernard Ghanem · Tao Xiang · Juan-Manuel Pérez-Rúa

Efficient Multimodal Fusion via Interactive Prompting

Yaowei Li · Ruijie Quan · Linchao Zhu · Yi Yang

NS3D: Neuro-Symbolic Grounding of 3D Objects and Relations

Joy Hsu · Jiayuan Mao · Jiajun Wu

Dynamic Inference With Grounding Based Vision and Language Models

Burak Uzkent · Amanmeet Garg · Wentao Zhu · Keval Doshi · Jingru Yi · Xiaolong Wang · Mohamed Omar

Improving Commonsense in Vision-Language Models via Knowledge Graph Riddles

Shuquan Ye · Yujia Xie · Dongdong Chen · Yichong Xu · Lu Yuan · Chenguang Zhu · Jing Liao

S3C: Semi-Supervised VQA Natural Language Explanation via Self-Critical Learning

Wei Suo · Mengyang Sun · Weisong Liu · Yiqi Gao · Peng Wang · Yanning Zhang · Qi Wu

Teaching Structured Vision & Language Concepts to Vision & Language Models

Sivan Doveh · Assaf Arbelle · Sivan Harary · Eli Schwartz · Roei Herzig · Raja Giryes · Rogerio Feris · Rameswar Panda · Shimon Ullman · Leonid Karlinsky

FAME-ViL: Multi-Tasking Vision-Language Model for Heterogeneous Fashion Tasks

Xiao Han · Xiatian Zhu · Licheng Yu · Li Zhang · Yi-Zhe Song · Tao Xiang

RefCLIP: A Universal Teacher for Weakly Supervised Referring Expression Comprehension

Lei Jin · Gen Luo · Yiyi Zhou · Xiaoshuai Sun · Guannan Jiang · Annan Shu · Rongrong Ji

Uni-Perceiver v2: A Generalist Model for Large-Scale Vision and Vision-Language Tasks

Hao Li · Jinguo Zhu · Xiaohu Jiang · Xizhou Zhu · Hongsheng Li · Chun Yuan · Xiaohua Wang · Yu Qiao · Xiaogang Wang · Wenhai Wang · Jifeng Dai

Learning From Unique Perspectives: User-Aware Saliency Modeling

Shi Chen · Nachiappan Valliappan · Shaolei Shen · Xinyu Ye · Kai Kohlhoff · Junfeng He

CRAFT: Concept Recursive Activation FacTorization for Explainability

Thomas Fel · Agustin Picard · Louis Béthune · Thibaut Boissin · David Vigouroux · Julien Colin · Rémi Cadène · Thomas Serre

Doubly Right Object Recognition: A Why Prompt for Visual Rationales

Chengzhi Mao · Revant Teotia · Amrutha Sundar · Sachit Menon · Junfeng Yang · Xin Wang · Carl Vondrick

Sketch2Saliency: Learning To Detect Salient Objects From Human Drawings

Ayan Kumar Bhunia · Subhadeep Koley · Amandeep Kumar · Aneeshan Sain · Pinaki Nath Chowdhury · Tao Xiang · Yi-Zhe Song

PIP-Net: Patch-Based Intuitive Prototypes for Interpretable Image Classification

Meike Nauta · Jörg Schlötterer · Maurice van Keulen · Christin Seifert

Photo Pre-Training, but for Sketch

Ke Li · Kaiyue Pang · Yi-Zhe Song

CLIP for All Things Zero-Shot Sketch-Based Image Retrieval, Fine-Grained or Not

Aneeshan Sain · Ayan Kumar Bhunia · Pinaki Nath Chowdhury · Subhadeep Koley · Tao Xiang · Yi-Zhe Song

iCLIP: Bridging Image Classification and Contrastive Language-Image Pre-Training for Visual Recognition

Yixuan Wei · Yue Cao · Zheng Zhang · Houwen Peng · Zhuliang Yao · Zhenda Xie · Han Hu · Baining Guo

Cross-Modal Implicit Relation Reasoning and Aligning for Text-to-Image Person Retrieval

Ding Jiang · Mang Ye

Multi-Modal Representation Learning With Text-Driven Soft Masks

Jaeyoo Park · Bohyung Han

Texts as Images in Prompt Tuning for Multi-Label Image Recognition

Zixian Guo · Bowen Dong · Zhilong Ji · Jinfeng Bai · Yiwen Guo · Wangmeng Zuo

Reproducible Scaling Laws for Contrastive Language-Image Learning

Mehdi Cherti · Romain Beaumont · Ross Wightman · Mitchell Wortsman · Gabriel Ilharco · Cade Gordon · Christoph Schuhmann · Ludwig Schmidt · Jenia Jitsev

Multilateral Semantic Relations Modeling for Image Text Retrieval

Zheng Wang · Zhenwei Gao · Kangshuai Guo · Yang Yang · Xiaoming Wang · Heng Tao Shen

SmallCap: Lightweight Image Captioning Prompted With Retrieval Augmentation

Rita Ramos · Bruno Martins · Desmond Elliott · Yova Kementchedjhieva

Probing Sentiment-Oriented Pre-Training Inspired by Human Sentiment Perception Mechanism

Tinglei Feng · Jiaxuan Liu · Jufeng Yang

Prefix Conditioning Unifies Language and Label Supervision

Kuniaki Saito · Kihyuk Sohn · Xiang Zhang · Chun-Liang Li · Chen-Yu Lee · Kate Saenko · Tomas Pfister

Crossing the Gap: Domain Generalization for Image Captioning

Yuchen Ren · Zhendong Mao · Shancheng Fang · Yan Lu · Tong He · Hao Du · Yongdong Zhang · Wanli Ouyang

A Bag-of-Prototypes Representation for Dataset-Level Applications

Weijie Tu · Weijian Deng · Tom Gedeon · Liang Zheng

CrowdCLIP: Unsupervised Crowd Counting via Vision-Language Model

Dingkang Liang · Jiahao Xie · Zhikang Zou · Xiaoqing Ye · Wei Xu · Xiang Bai

D2Former: Jointly Learning Hierarchical Detectors and Contextual Descriptors via Agent-Based Transformers

Jianfeng He · Yuan Gao · Tianzhu Zhang · Zhe Zhang · Feng Wu

Learning To Generate Language-Supervised and Open-Vocabulary Scene Graph Using Pre-Trained Visual-Semantic Space

Yong Zhang · Yingwei Pan · Ting Yao · Rui Huang · Tao Mei · Chang-Wen Chen

Relational Context Learning for Human-Object Interaction Detection

Sanghyun Kim · Deunsol Jung · Minsu Cho

Learning Open-Vocabulary Semantic Segmentation Models From Natural Language Supervision

Jilan Xu · Junlin Hou · Yuejie Zhang · Rui Feng · Yi Wang · Yu Qiao · Weidi Xie

Side Adapter Network for Open-Vocabulary Semantic Segmentation

Mengde Xu · Zheng Zhang · Fangyun Wei · Han Hu · Xiang Bai

Open-Vocabulary Panoptic Segmentation With Text-to-Image Diffusion Models

Jiarui Xu · Sifei Liu · Arash Vahdat · Wonmin Byeon · Xiaolong Wang · Shalini De Mello

IFSeg: Image-Free Semantic Segmentation via Vision-Language Model

Sukmin Yun · Seong Hyeon Park · Paul Hongsuck Seo · Jinwoo Shin

PartManip: Learning Cross-Category Generalizable Part Manipulation Policy From Point Cloud Observations

Haoran Geng · Ziming Li · Yiran Geng · Jiayi Chen · Hao Dong · He Wang

OneFormer: One Transformer To Rule Universal Image Segmentation

Jitesh Jain · Jiachen Li · Mang Tik Chiu · Ali Hassani · Nikita Orlov · Humphrey Shi

Delving Into Shape-Aware Zero-Shot Semantic Segmentation

Xinyu Liu · Beiwen Tian · Zhen Wang · Rui Wang · Kehua Sheng · Bo Zhang · Hao Zhao · Guyue Zhou

CoMFormer: Continual Learning in Semantic and Panoptic Segmentation

Fabio Cermelli · Matthieu Cord · Arthur Douillard

Learning To Segment Every Referring Object Point by Point

Mengxue Qu · Yu Wu · Yunchao Wei · Wu Liu · Xiaodan Liang · Yao Zhao

Unsupervised Continual Semantic Adaptation Through Neural Rendering

Zhizheng Liu · Francesco Milano · Jonas Frey · Roland Siegwart · Hermann Blum · Cesar Cadena

Mask DINO: Towards a Unified Transformer-Based Framework for Object Detection and Segmentation

Feng Li · Hao Zhang · Huaizhe Xu · Shilong Liu · Lei Zhang · Lionel M. Ni · Heung-Yeung Shum

Transformer Scale Gate for Semantic Segmentation

Hengcan Shi · Munawar Hayat · Jianfei Cai

Style Projected Clustering for Domain Generalized Semantic Segmentation

Wei Huang · Chang Chen · Yong Li · Jiacheng Li · Cheng Li · Fenglong Song · Youliang Yan · Zhiwei Xiong

Rethinking Few-Shot Medical Segmentation: A Vector Quantization View

Shiqi Huang · Tingfa Xu · Ning Shen · Feng Mu · Jianan Li

Continual Semantic Segmentation With Automatic Memory Sample Selection

Lanyun Zhu · Tianrun Chen · Jianxiong Yin · Simon See · Jun Liu

Token Contrast for Weakly-Supervised Semantic Segmentation

Lixiang Ru · Heliang Zheng · Yibing Zhan · Bo Du

Multi-Granularity Archaeological Dating of Chinese Bronze Dings Based on a Knowledge-Guided Relation Graph

Rixin Zhou · Jiafu Wei · Qian Zhang · Ruihua Qi · Xi Yang · Chuntao Li

Hunting Sparsity: Density-Guided Contrastive Learning for Semi-Supervised Semantic Segmentation

Xiaoyang Wang · Bingfeng Zhang · Limin Yu · Jimin Xiao

Cut and Learn for Unsupervised Object Detection and Instance Segmentation

Xudong Wang · Rohit Girdhar · Stella X. Yu · Ishan Misra

Extracting Class Activation Maps From Non-Discriminative Features As Well

Zhaozheng Chen · Qianru Sun

BoxTeacher: Exploring High-Quality Pseudo Labels for Weakly Supervised Instance Segmentation

Tianheng Cheng · Xinggang Wang · Shaoyu Chen · Qian Zhang · Wenyu Liu

Hierarchical Fine-Grained Image Forgery Detection and Localization

Xiao Guo · Xiaohong Liu · Zhiyuan Ren · Steven Grosz · Iacopo Masi · Xiaoming Liu

Towards Professional Level Crowd Annotation of Expert Domain Data

Pei Wang · Nuno Vasconcelos

Unsupervised Object Localization: Observing the Background To Discover Objects

Oriane Siméoni · Chloé Sekkat · Gilles Puy · Antonín Vobecký · Éloi Zablocki · Patrick Pérez

Semi-Supervised Learning Made Simple With Self-Supervised Clustering

Enrico Fini · Pietro Astolfi · Karteek Alahari · Xavier Alameda-Pineda · Julien Mairal · Moin Nabi · Elisa Ricci

Unbalanced Optimal Transport: A Unified Framework for Object Detection

Henri De Plaen · Pierre-François De Plaen · Johan A. K. Suykens · Marc Proesmans · Tinne Tuytelaars · Luc Van Gool

DiGeo: Discriminative Geometry-Aware Learning for Generalized Few-Shot Object Detection

Jiawei Ma · Yulei Niu · Jincheng Xu · Shiyuan Huang · Guangxing Han · Shih-Fu Chang

CLIP the Gap: A Single Domain Generalization Approach for Object Detection

Vidit Vidit · Martin Engilberge · Mathieu Salzmann

Unknown Sniffer for Object Detection: Don’t Turn a Blind Eye to Unknown Objects

Wenteng Liang · Feng Xue · Yihao Liu · Guofeng Zhong · Anlong Ming

Consistent-Teacher: Towards Reducing Inconsistent Pseudo-Targets in Semi-Supervised Object Detection

Xinjiang Wang · Xingyi Yang · Shilong Zhang · Yijiang Li · Litong Feng · Shijie Fang · Chengqi Lyu · Kai Chen · Wayne Zhang

Optimal Proposal Learning for Deployable End-to-End Pedestrian Detection

Xiaolin Song · Binghui Chen · Pengyu Li · Jun-Yan He · Biao Wang · Yifeng Geng · Xuansong Xie · Honggang Zhang

AsyFOD: An Asymmetric Adaptation Paradigm for Few-Shot Domain Adaptive Object Detection

Yipeng Gao · Kun-Yu Lin · Junkai Yan · Yaowei Wang · Wei-Shi Zheng

Where Is My Spot? Few-Shot Image Generation via Latent Subspace Optimization

Chenxi Zheng · Bangzhen Liu · Huaidong Zhang · Xuemiao Xu · Shengfeng He

Uncertainty-Aware Optimal Transport for Semantically Coherent Out-of-Distribution Detection

Fan Lu · Kai Zhu · Wei Zhai · Kecheng Zheng · Yang Cao

MAESTER: Masked Autoencoder Guided Segmentation at Pixel Resolution for Accurate, Self-Supervised Subcellular Structure Recognition

Ronald Xie · Kuan Pang · Gary D. Bader · Bo Wang

Orthogonal Annotation Benefits Barely-Supervised Medical Image Segmentation

Heng Cai · Shumeng Li · Lei Qi · Qian Yu · Yinghuan Shi · Yang Gao

RepMode: Learning to Re-Parameterize Diverse Experts for Subcellular Structure Prediction

Donghao Zhou · Chunbin Gu · Junde Xu · Furui Liu · Qiong Wang · Guangyong Chen · Pheng-Ann Heng

Topology-Guided Multi-Class Cell Context Generation for Digital Pathology

Shahira Abousamra · Rajarsi Gupta · Tahsin Kurc · Dimitris Samaras · Joel Saltz · Chao Chen

Dynamic Graph Enhanced Contrastive Learning for Chest X-Ray Report Generation

Mingjie Li · Bingqian Lin · Zicong Chen · Haokun Lin · Xiaodan Liang · Xiaojun Chang

Benchmarking Self-Supervised Learning on Diverse Pathology Datasets

Mingu Kang · Heon Song · Seonwook Park · Donggeun Yoo · Sérgio Pereira

Multiple Instance Learning via Iterative Self-Paced Supervised Contrastive Learning

Kangning Liu · Weicheng Zhu · Yiqiu Shen · Sheng Liu · Narges Razavian · Krzysztof J. Geras · Carlos Fernandez-Granda

Learning Expressive Prompting With Residuals for Vision Transformers

Rajshekhar Das · Yonatan Dukler · Avinash Ravichandran · Ashwin Swaminathan

Decoupling MaxLogit for Out-of-Distribution Detection

Zihan Zhang · Xiang Xiang

Exploring Structured Semantic Prior for Multi Label Recognition With Incomplete Labels

Zixuan Ding · Ao Wang · Hui Chen · Qiang Zhang · Pengzhang Liu · Yongjun Bao · Weipeng Yan · Jungong Han

Bridging the Gap Between Model Explanations in Partially Annotated Multi-Label Classification

Youngwook Kim · Jae Myung Kim · Jieun Jeong · Cordelia Schmid · Zeynep Akata · Jungwoo Lee

DivClust: Controlling Diversity in Deep Clustering

Ioannis Maniadis Metaxas · Georgios Tzimiropoulos · Ioannis Patras

Deep Semi-Supervised Metric Learning With Mixed Label Propagation

Furen Zhuang · Pierre Moulin

Leveraging Inter-Rater Agreement for Classification in the Presence of Noisy Labels

Maria Sofia Bucarelli · Lucas Cassano · Federico Siciliano · Amin Mantrach · Fabrizio Silvestri

Modeling Inter-Class and Intra-Class Constraints in Novel Class Discovery

Wenbin Li · Zhichen Fan · Jing Huo · Yang Gao

Bootstrap Your Own Prior: Towards Distribution-Agnostic Novel Class Discovery

Muli Yang · Liancheng Wang · Cheng Deng · Hanwang Zhang

Towards Realistic Long-Tailed Semi-Supervised Learning: Consistency Is All You Need

Tong Wei · Kai Gan

PromptCAL: Contrastive Affinity Learning via Auxiliary Prompts for Generalized Novel Category Discovery

Sheng Zhang · Salman Khan · Zhiqiang Shen · Muzammal Naseer · Guangyi Chen · Fahad Shahbaz Khan

Probabilistic Knowledge Distillation of Face Ensembles

Jianqing Xu · Shen Li · Ailin Deng · Miao Xiong · Jiaying Wu · Jiaxiang Wu · Shouhong Ding · Bryan Hooi

Class-Conditional Sharpness-Aware Minimization for Deep Long-Tailed Recognition

Zhipeng Zhou · Lanqing Li · Peilin Zhao · Pheng-Ann Heng · Wei Gong

Promoting Semantic Connectivity: Dual Nearest Neighbors Contrastive Learning for Unsupervised Domain Generalization

Yuchen Liu · Yaoming Wang · Yabo Chen · Wenrui Dai · Chenglin Li · Junni Zou · Hongkai Xiong

Instance Relation Graph Guided Source-Free Domain Adaptive Object Detection

Vibashan VS · Poojan Oza · Vishal M. Patel

MOT: Masked Optimal Transport for Partial Domain Adaptation

You-Wei Luo · Chuan-Xian Ren

TOPLight: Lightweight Neural Networks With Task-Oriented Pretraining for Visible-Infrared Recognition

Hao Yu · Xu Cheng · Wei Peng

OSAN: A One-Stage Alignment Network To Unify Multimodal Alignment and Unsupervised Domain Adaptation

Ye Liu · Lingfeng Qiao · Changchong Lu · Di Yin · Chen Lin · Haoyuan Peng · Bo Ren

Patch-Mix Transformer for Unsupervised Domain Adaptation: A Game Perspective

Jinjing Zhu · Haotian Bai · Lin Wang

ARO-Net: Learning Implicit Fields From Anchored Radial Observations

Yizhi Wang · Zeyu Huang · Ariel Shamir · Hui Huang · Hao Zhang · Ruizhen Hu

A Probabilistic Framework for Lifelong Test-Time Adaptation

Dhanajit Brahma · Piyush Rai

Distribution Shift Inversion for Out-of-Distribution Prediction

Runpeng Yu · Songhua Liu · Xingyi Yang · Xinchao Wang

Learning Joint Latent Space EBM Prior Model for Multi-Layer Generator

Jiali Cui · Ying Nian Wu · Tian Han

A Data-Based Perspective on Transfer Learning

Saachi Jain · Hadi Salman · Alaa Khaddaj · Eric Wong · Sung Min Park · Aleksander Mądry

A Meta-Learning Approach to Predicting Performance and Data Requirements

Achin Jain · Gurumurthy Swaminathan · Paolo Favaro · Hao Yang · Avinash Ravichandran · Hrayr Harutyunyan · Alessandro Achille · Onkar Dabeer · Bernt Schiele · Ashwin Swaminathan · Stefano Soatto

Guided Recommendation for Model Fine-Tuning

Hao Li · Charless Fowlkes · Hao Yang · Onkar Dabeer · Zhuowen Tu · Stefano Soatto

EMT-NAS:Transferring Architectural Knowledge Between Tasks From Different Datasets

Peng Liao · Yaochu Jin · Wenli Du

AttriCLIP: A Non-Incremental Learner for Incremental Knowledge Learning

Runqi Wang · Xiaoyue Duan · Guoliang Kang · Jianzhuang Liu · Shaohui Lin · Songcen Xu · Jinhu Lü · Baochang Zhang

Batch Model Consolidation: A Multi-Task Model Consolidation Framework

Iordanis Fostiropoulos · Jiaye Zhu · Laurent Itti

SmartAssign: Learning a Smart Knowledge Assignment Strategy for Deraining and Desnowing

Yinglong Wang · Chao Ma · Jianzhuang Liu

TinyMIM: An Empirical Study of Distilling MIM Pre-Trained Models

Sucheng Ren · Fangyun Wei · Zheng Zhang · Han Hu

Computationally Budgeted Continual Learning: What Does Matter?

Ameya Prabhu · Hasan Abed Al Kader Hammoud · Puneet K. Dokania · Philip H.S. Torr · Ser-Nam Lim · Bernard Ghanem · Adel Bibi

GradMA: A Gradient-Memory-Based Accelerated Federated Learning With Alleviated Catastrophic Forgetting

Kangyang Luo · Xiang Li · Yunshi Lan · Ming Gao

Rethinking Gradient Projection Continual Learning: Stability / Plasticity Feature Space Decoupling

Zhen Zhao · Zhizhong Zhang · Xin Tan · Jun Liu · Yanyun Qu · Yuan Xie · Lizhuang Ma

Neuro-Modulated Hebbian Learning for Fully Test-Time Adaptation

Yushun Tang · Ce Zhang · Heng Xu · Shuoshuo Chen · Jie Cheng · Luziwei Leng · Qinghai Guo · Zhihai He

Generalizing Dataset Distillation via Deep Generative Prior

George Cazenavette · Tongzhou Wang · Antonio Torralba · Alexei A. Efros · Jun-Yan Zhu

Minimizing the Accumulated Trajectory Error To Improve Dataset Distillation

Jiawei Du · Yidi Jiang · Vincent Y. F. Tan · Joey Tianyi Zhou · Haizhou Li

Slimmable Dataset Condensation

Songhua Liu · Jingwen Ye · Runpeng Yu · Xinchao Wang

Sharpness-Aware Gradient Matching for Domain Generalization

Pengfei Wang · Zhaoxiang Zhang · Zhen Lei · Lei Zhang

Dynamic Neural Network for Multi-Task Learning Searching Across Diverse Network Topologies

Wonhyeok Choi · Sunghoon Im

SplineCam: Exact Visualization and Characterization of Deep Network Geometry and Decision Boundaries

Ahmed Imtiaz Humayun · Randall Balestriero · Guha Balakrishnan · Richard G. Baraniuk

VNE: An Effective Method for Improving Deep Representation by Manipulating Eigenvalue Distribution

Jaeill Kim · Suhyun Kang · Duhun Hwang · Jungwook Shin · Wonjong Rhee

Efficient On-Device Training via Gradient Filtering

Yuedong Yang · Guihong Li · Radu Marculescu

Are Data-Driven Explanations Robust Against Out-of-Distribution Data?

Tang Li · Fengchun Qiao · Mengmeng Ma · Xi Peng

BiasAdv: Bias-Adversarial Augmentation for Model Debiasing

Jongin Lim · Youngdong Kim · Byungjai Kim · Chanho Ahn · Jinwoo Shin · Eunho Yang · Seungju Han

Q-DETR: An Efficient Low-Bit Quantized Detection Transformer

Sheng Xu · Yanjing Li · Mingbao Lin · Peng Gao · Guodong Guo · Jinhu Lü · Baochang Zhang

NIPQ: Noise Proxy-Based Integrated Pseudo-Quantization

Juncheol Shin · Junhyuk So · Sein Park · Seungyeop Kang · Sungjoo Yoo · Eunhyeok Park

CUDA: Convolution-Based Unlearnable Datasets

Vinu Sankar Sadasivan · Soltanolkotabi · Soheil Feizi

KD-DLGAN: Data Limited Image Generation via Knowledge Distillation

Kaiwen Cui · Yingchen Yu · Fangneng Zhan · Shengcai Liao · Shijian Lu · Eric P. Xing

Spider GAN: Leveraging Friendly Neighbors To Accelerate GAN Training

Siddarth Asokan · Chandra Sekhar Seelamantula

Efficient Verification of Neural Networks Against LVM-Based Specifications

Harleen Hanspal · Alessio Lomuscio

Bi-Directional Feature Fusion Generative Adversarial Network for Ultra-High Resolution Pathological Image Virtual Re-Staining

Kexin Sun · Zhineng Chen · Gongwei Wang · Jun Liu · Xiongjun Ye · Yu-Gang Jiang

DeSTSeg: Segmentation Guided Denoising Student-Teacher for Anomaly Detection

Xuan Zhang · Shiyu Li · Xi Li · Ping Huang · Jiulong Shan · Ting Chen

OmniAL: A Unified CNN Framework for Unsupervised Anomaly Localization

Ying Zhao

Federated Incremental Semantic Segmentation

Jiahua Dong · Duzhen Zhang · Yang Cong · Wei Cong · Henghui Ding · Dengxin Dai

Re-Thinking Federated Active Learning Based on Inter-Class Diversity

SangMook Kim · Sangmin Bae · Hwanjun Song · Se-Young Yun

Federated Domain Generalization With Generalization Adjustment

Ruipeng Zhang · Qinwei Xu · Jiangchao Yao · Ya Zhang · Qi Tian · Yanfeng Wang

On the Effectiveness of Partial Variance Reduction in Federated Learning With Heterogeneous Data

Bo Li · Mikkel N. Schmidt · Tommy S. Alstrøm · Sebastian U. Stich

The Resource Problem of Using Linear Layer Leakage Attack in Federated Learning

Joshua C. Zhao · Ahmed Roushdy Elkordy · Atul Sharma · Yahya H. Ezzeldin · Salman Avestimehr · Saurabh Bagchi

Unlearnable Clusters: Towards Label-Agnostic Unlearnable Examples

Jiaming Zhang · Xingjun Ma · Qi Yi · Jitao Sang · Yu-Gang Jiang · Yaowei Wang · Changsheng Xu

Implicit Identity Leakage: The Stumbling Block to Improving Deepfake Detection Generalization

Shichao Dong · Jin Wang · Renhe Ji · Jiajun Liang · Haoqiang Fan · Zheng Ge

Backdoor Defense via Adaptively Splitting Poisoned Dataset

Kuofeng Gao · Yang Bai · Jindong Gu · Yong Yang · Shu-Tao Xia

How to Backdoor Diffusion Models?

Sheng-Yen Chou · Pin-Yu Chen · Tsung-Yi Ho

TrojViT: Trojan Insertion in Vision Transformers

Mengxin Zheng · Qian Lou · Lei Jiang

TrojDiff: Trojan Attacks on Diffusion Models With Diverse Targets

Weixin Chen · Dawn Song · Bo Li

Ensemble-Based Blackbox Attacks on Dense Prediction

Zikui Cai · Yaoteng Tan · M. Salman Asif

Efficient Loss Function by Minimizing the Detrimental Effect of Floating-Point Errors on Gradient-Based Attacks

Yunrui Yu · Cheng-Zhong Xu

The Best Defense Is a Good Offense: Adversarial Augmentation Against Adversarial Attacks

Iuri Frosio · Jan Kautz

Adversarial Robustness via Random Projection Filters

Minjing Dong · Chang Xu

Jedi: Entropy-Based Localization and Removal of Adversarial Patches

Bilel Tarchoun · Anouar Ben Khalifa · Mohamed Ali Mahjoub · Nael Abu-Ghazaleh · Ihsen Alouani

Exploring the Relationship Between Architectural Design and Adversarially Robust Generalization

Aishan Liu · Shiyu Tang · Siyuan Liang · Ruihao Gong · Boxi Wu · Xianglong Liu · Dacheng Tao

Improving Robustness of Vision Transformers by Reducing Sensitivity To Patch Corruptions

Yong Guo · David Stutz · Bernt Schiele

Towards Effective Adversarial Textured 3D Meshes on Physical Face Recognition

Xiao Yang · Chang Liu · Longlong Xu · Yikai Wang · Yinpeng Dong · Ning Chen · Hang Su · Jun Zhu

AltFreezing for More General Video Face Forgery Detection

Zhendong Wang · Jianmin Bao · Wengang Zhou · Weilun Wang · Houqiang Li

Go to Event Page

Panel

History and Future of Artificial Intelligence and Computer Vision

Chelsea Finn · Dan Huttenlocher · Linda Shapiro · Jamie Shotton

2:00 PM - 3:00 PM

Award

Award Candidates TUE

Andreas Geiger

3:00 PM - 4:00 PM

... more

Poster

Poster Session TUE-PM

4:30 PM - 6:00 PM

394 Events in this session

Passive Micron-Scale Time-of-Flight With Sunlight Interferometry

Alankar Kotwal · Anat Levin · Ioannis Gkioulekas

F2-NeRF: Fast Neural Radiance Field Training With Free Camera Trajectories

Peng Wang · Yuan Liu · Zhaoxi Chen · Lingjie Liu · Ziwei Liu · Taku Komura · Christian Theobalt · Wenping Wang

NoPe-NeRF: Optimising Neural Radiance Field With No Pose Prior

Wenjing Bian · Zirui Wang · Kejie Li · Jia-Wang Bian · Victor Adrian Prisacariu

BAD-NeRF: Bundle Adjusted Deblur Neural Radiance Fields

Peng Wang · Lingzhe Zhao · Ruijie Ma · Peidong Liu

DiffusioNeRF: Regularizing Neural Radiance Fields With Denoising Diffusion Models

Jamie Wynn · Daniyar Turmukhambetov

SPARF: Neural Radiance Fields From Sparse and Noisy Poses

Prune Truong · Marie-Julie Rakotosaona · Fabian Manhardt · Federico Tombari

Interactive Segmentation of Radiance Fields

Rahul Goel · Dhawal Sirikonda · Saurabh Saini · P. J. Narayanan

Temporal Interpolation Is All You Need for Dynamic Neural Radiance Fields

Sungheon Park · Minjung Son · Seokhwan Jang · Young Chun Ahn · Ji-Yeon Kim · Nahyup Kang

Compressing Volumetric Radiance Fields to 1 MB

Lingzhi Li · Zhen Shen · Zhongshu Wang · Li Shen · Liefeng Bo

Multiscale Tensor Decomposition and Rendering Equation Encoding for View Synthesis

Kang Han · Wei Xiang

Ref-NPR: Reference-Based Non-Photorealistic Radiance Fields for Controllable Scene Stylization

Yuechen Zhang · Zexin He · Jinbo Xing · Xufeng Yao · Jiaya Jia

Representing Volumetric Videos As Dynamic MLP Maps

Sida Peng · Yunzhi Yan · Qing Shuai · Hujun Bao · Xiaowei Zhou

Fast Monocular Scene Reconstruction With Global-Sparse Local-Dense Grids

Wei Dong · Christopher Choy · Charles Loop · Or Litany · Yuke Zhu · Anima Anandkumar

DynIBaR: Neural Dynamic Image-Based Rendering

Zhengqi Li · Qianqian Wang · Forrester Cole · Richard Tucker · Noah Snavely

Plateau-Reduced Differentiable Path Tracing

Michael Fischer · Tobias Ritschel

NeFII: Inverse Rendering for Reflectance Decomposition With Near-Field Indirect Illumination

Haoqian Wu · Zhipeng Hu · Lincheng Li · Yongqiang Zhang · Changjie Fan · Xin Yu

WildLight: In-the-Wild Inverse Rendering With a Flashlight

Ziang Cheng · Junxuan Li · Hongdong Li

Relightable Neural Human Assets From Multi-View Gradient Illuminations

Taotao Zhou · Kai He · Di Wu · Teng Xu · Qixuan Zhang · Kuixiang Shao · Wenzheng Chen · Lan Xu · Jingyi Yu

DiffRF: Rendering-Guided 3D Radiance Field Diffusion

Norman Müller · Yawar Siddiqui · Lorenzo Porzi · Samuel Rota Bulò · Peter Kontschieder · Matthias Nießner

Analyzing Physical Impacts Using Transient Surface Wave Imaging

Tianyuan Zhang · Mark Sheinin · Dorian Chan · Mark Rau · Matthew O’Toole · Srinivasa G. Narasimhan

Neural Kaleidoscopic Space Sculpting

Byeongjoo Ahn · Michael De Zeeuw · Ioannis Gkioulekas · Aswin C. Sankaranarayanan

Towards Unbiased Volume Rendering of Neural Implicit Surfaces With Geometry Priors

Yongqiang Zhang · Zhipeng Hu · Haoqian Wu · Minda Zhao · Lincheng Li · Zhengxia Zou · Changjie Fan

Neural Kernel Surface Reconstruction

Jiahui Huang · Zan Gojcic · Matan Atzmon · Or Litany · Sanja Fidler · Francis Williams

MM-3DScene: 3D Scene Understanding by Customizing Masked Modeling With Informative-Preserved Reconstruction and Self-Distilled Consistency

Mingye Xu · Mutian Xu · Tong He · Wanli Ouyang · Yali Wang · Xiaoguang Han · Yu Qiao

Shape, Pose, and Appearance From a Single Image via Bootstrapped Radiance Field Inversion

Dario Pavllo · David Joseph Tan · Marie-Julie Rakotosaona · Federico Tombari

DisCoScene: Spatially Disentangled Generative Radiance Fields for Controllable 3D-Aware Scene Synthesis

Yinghao Xu · Menglei Chai · Zifan Shi · Sida Peng · Ivan Skorokhodov · Aliaksandr Siarohin · Ceyuan Yang · Yujun Shen · Hsin-Ying Lee · Bolei Zhou · Sergey Tulyakov

Heat Diffusion Based Multi-Scale and Geometric Structure-Aware Transformer for Mesh Segmentation

Chi-Chong Wong

Learning Detailed Radiance Manifolds for High-Fidelity and 3D-Consistent Portrait Synthesis From Monocular Image

Yu Deng · Baoyuan Wang · Heung-Yeung Shum

3D-Aware Conditional Image Synthesis

Kangle Deng · Gengshan Yang · Deva Ramanan · Jun-Yan Zhu

VIVE3D: Viewpoint-Independent Video Editing Using 3D-Aware GANs

Anna Frühstück · Nikolaos Sarafianos · Yuanlu Xu · Peter Wonka · Tony Tung

SDFusion: Multimodal 3D Shape Completion, Reconstruction, and Generation

Yen-Chi Cheng · Hsin-Ying Lee · Sergey Tulyakov · Alexander G. Schwing · Liang-Yan Gui

Generating Part-Aware Editable 3D Shapes Without 3D Supervision

Konstantinos Tertikas · Despoina Paschalidou · Boxiao Pan · Jeong Joon Park · Mikaela Angelina Uy · Ioannis Emiris · Yannis Avrithis · Leonidas Guibas

NeuralLift-360: Lifting an In-the-Wild 2D Photo to a 3D Object With 360° Views

Dejia Xu · Yifan Jiang · Peihao Wang · Zhiwen Fan · Yi Wang · Zhangyang Wang

Implicit Identity Driven Deepfake Face Swapping Detection

Baojin Huang · Zhongyuan Wang · Jifan Yang · Jiaxin Ai · Qin Zou · Qian Wang · Dengpan Ye

Canonical Fields: Self-Supervised Learning of Pose-Canonicalized Neural Fields

Rohith Agaram · Shaurya Dewan · Rahul Sajnani · Adrien Poulenard · Madhava Krishna · Srinath Sridhar

Improving Fairness in Facial Albedo Estimation via Visual-Textual Cues

Xingyu Ren · Jiankang Deng · Chao Ma · Yichao Yan · Xiaokang Yang

High-Fidelity 3D Face Generation From Natural Language Descriptions

Menghua Wu · Hao Zhu · Linjia Huang · Yiyu Zhuang · Yuanxun Lu · Xun Cao

DSFNet: Dual Space Fusion Network for Occlusion-Robust 3D Dense Face Alignment

Heyuan Li · Bo Wang · Yu Cheng · Mohan Kankanhalli · Robby T. Tan

High-Fidelity Facial Avatar Reconstruction From Monocular Video With Generative Priors

Yunpeng Bai · Yanbo Fan · Xuan Wang · Yong Zhang · Jingxiang Sun · Chun Yuan · Ying Shan

3DAvatarGAN: Bridging Domains for Personalized Editable Avatars

Rameen Abdal · Hsin-Ying Lee · Peihao Zhu · Menglei Chai · Aliaksandr Siarohin · Peter Wonka · Sergey Tulyakov

RODIN: A Generative Model for Sculpting 3D Digital Avatars Using Diffusion

Tengfei Wang · Bo Zhang · Ting Zhang · Shuyang Gu · Jianmin Bao · Tadas Baltrusaitis · Jingjing Shen · Dong Chen · Fang Wen · Qifeng Chen · Baining Guo

Instant Volumetric Head Avatars

Wojciech Zielonka · Timo Bolkart · Justus Thies

Synthesizing Photorealistic Virtual Humans Through Cross-Modal Disentanglement

Siddarth Ravichandran · Ondřej Texler · Dimitar Dinev · Hyun Jae Kang

3D Cinemagraphy From a Single Image

Xingyi Li · Zhiguo Cao · Huiqiang Sun · Jianming Zhang · Ke Xian · Guosheng Lin

TryOnDiffusion: A Tale of Two UNets

Luyang Zhu · Dawei Yang · Tyler Zhu · Fitsum Reda · William Chan · Chitwan Saharia · Mohammad Norouzi · Ira Kemelmacher-Shlizerman

Diverse 3D Hand Gesture Prediction From Body Dynamics by Bilateral Hand Disentanglement

Xingqun Qi · Chen Liu · Muyi Sun · Lincheng Li · Changjie Fan · Xin Yu

Normal-Guided Garment UV Prediction for Human Re-Texturing

Yasamin Jafarian · Tuanfeng Y. Wang · Duygu Ceylan · Jimei Yang · Nathan Carr · Yi Zhou · Hyun Soo Park

REC-MV: REconstructing 3D Dynamic Cloth From Monocular Videos

Lingteng Qiu · Guanying Chen · Jiapeng Zhou · Mutian Xu · Junle Wang · Xiaoguang Han

SeSDF: Self-Evolved Signed Distance Field for Implicit 3D Clothed Human Reconstruction

Yukang Cao · Kai Han · Kwan-Yee K. Wong

Unsupervised Volumetric Animation

Aliaksandr Siarohin · Willi Menapace · Ivan Skorokhodov · Kyle Olszewski · Jian Ren · Hsin-Ying Lee · Menglei Chai · Sergey Tulyakov

Handy: Towards a High Fidelity 3D Hand Shape and Appearance Model

Rolandos Alexandros Potamias · Stylianos Ploumpis · Stylianos Moschoglou · Vasileios Triantafyllou · Stefanos Zafeiriou

Fantastic Breaks: A Dataset of Paired 3D Scans of Real-World Broken Objects and Their Complete Counterparts

Nikolas Lamb · Cameron Palmer · Benjamin Molloy · Sean Banerjee · Natasha Kholgade Banerjee

Distilling Neural Fields for Real-Time Articulated Shape Reconstruction

Jeff Tan · Gengshan Yang · Deva Ramanan

GANmouflage: 3D Object Nondetection With Texture Fields

Rui Guo · Jasmine Collins · Oscar de Lima · Andrew Owens

3D Human Pose Estimation via Intuitive Physics

Shashank Tripathi · Lea Müller · Chun-Hao P. Huang · Omid Taheri · Michael J. Black · Dimitrios Tzionas

Object Pop-Up: Can We Infer 3D Objects and Their Poses From Human Interactions Alone?

Ilya A. Petrov · Riccardo Marin · Julian Chibane · Gerard Pons-Moll

UniDexGrasp: Universal Robotic Dexterous Grasping via Learning Diverse Proposal Generation and Goal-Conditioned Policy

Yinzhen Xu · Weikang Wan · Jialiang Zhang · Haoran Liu · Zikang Shan · Hao Shen · Ruicheng Wang · Haoran Geng · Yijia Weng · Jiayi Chen · Tengyu Liu · Li Yi · He Wang

Constrained Evolutionary Diffusion Filter for Monocular Endoscope Tracking

Xiongbiao Luo

Visibility Aware Human-Object Interaction Tracking From Single RGB Camera

Xianghui Xie · Bharat Lal Bhatnagar · Gerard Pons-Moll

Transformer-Based Unified Recognition of Two Hands Manipulating Objects

Hoseong Cho · Chanwoo Kim · Jihyeon Kim · Seongyeong Lee · Elkhan Ismayilzada · Seungryul Baek

HuManiFlow: Ancestor-Conditioned Normalising Flows on SO(3) Manifolds for Human Pose and Shape Distribution Estimation

Akash Sengupta · Ignas Budvytis · Roberto Cipolla

3D Human Pose Estimation With Spatio-Temporal Criss-Cross Attention

Zhenhua Tang · Zhaofan Qiu · Yanbin Hao · Richang Hong · Ting Yao

GFPose: Learning 3D Human Pose Prior With Gradient Fields

Hai Ci · Mingdong Wu · Wentao Zhu · Xiaoxuan Ma · Hao Dong · Fangwei Zhong · Yizhou Wang

JRDB-Pose: A Large-Scale Dataset for Multi-Person Pose Estimation and Tracking

Edward Vendrow · Tho Le · Jianfei Cai · Hamid Rezatofighi

Analyzing and Diagnosing Pose Estimation With Attributions

Qiyuan He · Linlin Yang · Kerui Gu · Qiuxia Lin · Angela Yao

Shape-Constraint Recurrent Flow for 6D Object Pose Estimation

Yang Hai · Rui Song · Jiaojiao Li · Yinlin Hu

TexPose: Neural Texture Learning for Self-Supervised 6D Object Pose Estimation

Hanzhi Chen · Fabian Manhardt · Nassir Navab · Benjamin Busam

Hi-LASSIE: High-Fidelity Articulated Shape and Skeleton Discovery From Sparse Image Ensemble

Chun-Han Yao · Wei-Chih Hung · Yuanzhen Li · Michael Rubinstein · Ming-Hsuan Yang · Varun Jampani

Revisiting Rolling Shutter Bundle Adjustment: Toward Accurate and Fast Solution

Bangyan Liao · Delin Qu · Yifei Xue · Huiqing Zhang · Yizhen Lao

Revisiting the P3P Problem

Yaqing Ding · Jian Yang · Viktor Larsson · Carl Olsson · Kalle Åström

Common Pets in 3D: Dynamic New-View Synthesis of Real-Life Deformable Categories

Samarth Sinha · Roman Shapovalov · Jeremy Reizenstein · Ignacio Rocco · Natalia Neverova · Andrea Vedaldi · David Novotny

MobileBrick: Building LEGO for 3D Reconstruction on Mobile Devices

Kejie Li · Jia-Wang Bian · Robert Castle · Philip H.S. Torr · Victor Adrian Prisacariu

EFEM: Equivariant Neural Field Expectation Maximization for 3D Object Segmentation Without Scene Supervision

Jiahui Lei · Congyue Deng · Karl Schmeckpeper · Leonidas Guibas · Kostas Daniilidis

GINA-3D: Learning To Generate Implicit Neural Assets in the Wild

Bokui Shen · Xinchen Yan · Charles R. Qi · Mahyar Najibi · Boyang Deng · Leonidas Guibas · Yin Zhou · Dragomir Anguelov

Habitat-Matterport 3D Semantics Dataset

Karmesh Yadav · Ram Ramrakhya · Santhosh Kumar Ramakrishnan · Theo Gervet · John Turner · Aaron Gokaslan · Noah Maestre · Angel Xuan Chang · Dhruv Batra · Manolis Savva · Alexander William Clegg · Devendra Singh Chaplot

BUOL: A Bottom-Up Framework With Occupancy-Aware Lifting for Panoptic 3D Scene Reconstruction From a Single Image

Tao Chu · Pan Zhang · Qiong Liu · Jiaqi Wang

Panoptic Compositional Feature Field for Editable Scene Rendering With Network-Inferred Labels via Metric Learning

Xinhua Cheng · Yanmin Wu · Mengxi Jia · Qian Wang · Jian Zhang

A Light Touch Approach to Teaching Transformers Multi-View Geometry

Yash Bhalgat · João F. Henriques · Andrew Zisserman

Learning To Render Novel Views From Wide-Baseline Stereo Pairs

Yilun Du · Cameron Smith · Ayush Tewari · Vincent Sitzmann

Spring: A High-Resolution High-Detail Dataset and Benchmark for Scene Flow, Optical Flow and Stereo

Lukas Mehl · Jenny Schmalfuss · Azin Jahedi · Yaroslava Nalivayko · Andrés Bruhn

EventNeRF: Neural Radiance Fields From a Single Colour Event Camera

Viktor Rudnev · Mohamed Elgharib · Christian Theobalt · Vladislav Golyanik

LightedDepth: Video Depth Estimation in Light of Limited Inference View Angles

Shengjie Zhu · Xiaoming Liu

Generating Aligned Pseudo-Supervision From Non-Aligned Data for Image Restoration in Under-Display Camera

Ruicheng Feng · Chongyi Li · Huaijin Chen · Shuai Li · Jinwei Gu · Chen Change Loy

Spatio-Focal Bidirectional Disparity Estimation From a Dual-Pixel Image

Donggun Kim · Hyeonjoong Jang · Inchul Kim · Min H. Kim

Trap Attention: Monocular Depth Estimation With Manual Traps

Chao Ning · Hongping Gan

Accelerated Coordinate Encoding: Learning to Relocalize in Minutes Using RGB and Poses

Eric Brachmann · Tommaso Cavallari · Victor Adrian Prisacariu

Energy-Efficient Adaptive 3D Sensing

Brevin Tilmon · Zhanghao Sun · Sanjeev J. Koppal · Yicheng Wu · Georgios Evangelidis · Ramzi Zahreddine · Gurunandan Krishnan · Sizhuo Ma · Jian Wang

Incremental 3D Semantic Scene Graph Prediction From RGB Sequences

Shun-Cheng Wu · Keisuke Tateno · Nassir Navab · Federico Tombari

Consistent Direct Time-of-Flight Video Depth Super-Resolution

Zhanghao Sun · Wei Ye · Jinhui Xiong · Gyeongmin Choe · Jialiang Wang · Shuochen Su · Rakesh Ranjan

Learning To Zoom and Unzoom

Chittesh Thavamani · Mengtian Li · Francesco Ferroni · Deva Ramanan

FrustumFormer: Adaptive Instance-Aware Resampling for Multi-View 3D Detection

Yuqi Wang · Yuntao Chen · Zhaoxiang Zhang

3D Video Object Detection With Learnable Object-Centric Global Optimization

Jiawei He · Yuntao Chen · Naiyan Wang · Zhaoxiang Zhang

UniDistill: A Universal Cross-Modality Knowledge Distillation Framework for 3D Object Detection in Bird’s-Eye View

Shengchao Zhou · Weizhou Liu · Chen Hu · Shuchang Zhou · Chao Ma

ARKitTrack: A New Diverse Dataset for Tracking Using Mobile RGB-D Data

Haojie Zhao · Junsong Chen · Lijun Wang · Huchuan Lu

Deep Dive Into Gradients: Better Optimization for 3D Object Detection With Gradient-Corrected IoU Supervision

Qi Ming · Lingjuan Miao · Zhe Ma · Lin Zhao · Zhiqiang Zhou · Xuhui Huang · Yuanpei Chen · Yufei Guo

SlowLiDAR: Increasing the Latency of LiDAR-Based Detection Using Adversarial Examples

Han Liu · Yuhao Wu · Zhiyuan Yu · Yevgeniy Vorobeychik · Ning Zhang

Normalizing Flow Based Feature Synthesis for Outlier-Aware Object Detection

Nishant Kumar · Siniša Šegvić · Abouzar Eslami · Stefan Gumhold

OcTr: Octree-Based Transformer for 3D Object Detection

Chao Zhou · Yanan Zhang · Jiaxin Chen · Di Huang

HypLiLoc: Towards Effective LiDAR Pose Regression With Hyperbolic Fusion

Sijie Wang · Qiyu Kang · Rui She · Wei Wang · Kai Zhao · Yang Song · Wee Peng Tay

LiDAR2Map: In Defense of LiDAR-Based Semantic Map Construction Using Online Camera Distillation

Song Wang · Wentong Li · Wenyu Liu · Xiaolu Liu · Jianke Zhu

MSF: Motion-Guided Sequential Fusion for Efficient 3D Object Detection From Point Cloud Sequences

Chenhang He · Ruihuang Li · Yabin Zhang · Shuai Li · Lei Zhang

SFD2: Semantic-Guided Feature Detection and Description

Fei Xue · Ignas Budvytis · Roberto Cipolla

Temporal Consistent 3D LiDAR Representation Learning for Semantic Perception in Autonomous Driving

Lucas Nunes · Louis Wiesmann · Rodrigo Marcuzzi · Xieyuanli Chen · Jens Behley · Cyrill Stachniss

Unsupervised 3D Point Cloud Representation Learning by Triangle Constrained Contrast for Autonomous Driving

Bo Pang · Hongchi Xia · Cewu Lu

RangeViT: Towards Vision Transformers for 3D Semantic Segmentation in Autonomous Driving

Angelika Ando · Spyros Gidaris · Andrei Bursuc · Gilles Puy · Alexandre Boulch · Renaud Marlet

Spatiotemporal Self-Supervised Learning for Point Clouds in the Wild

Yanhao Wu · Tong Zhang · Wei Ke · Sabine Süsstrunk · Mathieu Salzmann

Change-Aware Sampling and Contrastive Learning for Satellite Images

Utkarsh Mall · Bharath Hariharan · Kavita Bala

Self-Supervised 3D Scene Flow Estimation Guided by Superpoints

Yaqi Shen · Le Hui · Jin Xie · Jian Yang

SCOOP: Self-Supervised Correspondence and Optimization-Based Scene Flow

Itai Lang · Dror Aiger · Forrester Cole · Shai Avidan · Michael Rubinstein

PiMAE: Point Cloud and Image Interactive Masked Autoencoders for 3D Object Detection

Anthony Chen · Kevin Zhang · Renrui Zhang · Zihan Wang · Yuheng Lu · Yandong Guo · Shanghang Zhang

CP3: Channel Pruning Plug-In for Point-Based Networks

Yaomin Huang · Ning Liu · Zhengping Che · Zhiyuan Xu · Chaomin Shen · Yaxin Peng · Guixu Zhang · Xinmei Liu · Feifei Feng · Jian Tang

Binarizing Sparse Convolutional Networks for Efficient Point Cloud Analysis

Xiuwei Xu · Ziwei Wang · Jie Zhou · Jiwen Lu

Hyperspherical Embedding for Point Cloud Completion

Junming Zhang · Haomeng Zhang · Ram Vasudevan · Matthew Johnson-Roberson

Attention-Based Point Cloud Edge Sampling

Chengzhi Wu · Junwei Zheng · Julius Pfrommer · Jürgen Beyerer

Starting From Non-Parametric Networks for 3D Point Cloud Analysis

Renrui Zhang · Liuhui Wang · Yali Wang · Peng Gao · Hongsheng Li · Jianbo Shi

Grad-PU: Arbitrary-Scale Point Cloud Upsampling via Gradient Descent With Learned Distance Functions

Yun He · Danhang Tang · Yinda Zhang · Xiangyang Xue · Yanwei Fu

SE-ORNet: Self-Ensembling Orientation-Aware Network for Unsupervised Point Cloud Shape Correspondence

Jiacheng Deng · Chuxin Wang · Jiahao Lu · Jianfeng He · Tianzhu Zhang · Jiyang Yu · Zhe Zhang

Robust 3D Shape Classification via Non-Local Graph Attention Network

Shengwei Qin · Zhong Li · Ligang Liu

Rotation-Invariant Transformer for Point Cloud Matching

Hao Yu · Zheng Qin · Ji Hou · Saleh · Dongsheng Li · Benjamin Busam · Slobodan Ilic

Deep Graph-Based Spatial Consistency for Robust Non-Rigid Point Cloud Registration

Zheng Qin · Hao Yu · Changjian Wang · Yuxing Peng · Kai Xu

Efficient RGB-T Tracking via Cross-Modality Distillation

Tianlu Zhang · Hongyuan Guo · Qiang Jiao · Qiang Zhang · Jungong Han

Finding Geometric Models by Clustering in the Consensus Space

Daniel Barath · Denys Rozumnyi · Ivan Eichhardt · Levente Hajder · Jiri Matas

Adaptive Assignment for Geometry Aware Local Feature Matching

Dihe Huang · Ying Chen · Yong Liu · Jianlin Liu · Shang Xu · Wenlong Wu · Yikang Ding · Fan Tang · Chengjie Wang

Masked Representation Learning for Domain Generalized Stereo Matching

Zhibo Rao · Bangshu Xiong · Mingyi He · Mochu Xiang · Renjie He · Zhelun Shen · Xing Li

Learning Optical Expansion From Scale Matching

Han Ling · Yinghui Sun · Quansen Sun · Zhenwen Ren

AnyFlow: Arbitrary Scale Optical Flow With Implicit Neural Representation

Hyunyoung Jung · Zhuo Hui · Lei Luo · Haitao Yang · Feng Liu · Sungjoo Yoo · Rakesh Ranjan · Denis Demandolx

HouseDiffusion: Vector Floorplan Generation via a Diffusion Model With Discrete and Continuous Denoising

Mohammad Amin Shabani · Sepidehsadat Hosseini · Yasutaka Furukawa

Localized Semantic Feature Mixers for Efficient Pedestrian Detection in Autonomous Driving

Abdul Hannan Khan · Mohammed Shariq Nawaz · Andreas Dengel

V2X-Seq: A Large-Scale Sequential Dataset for Vehicle-Infrastructure Cooperative Perception and Forecasting

Haibao Yu · Wenxian Yang · Hongzhi Ruan · Zhenwei Yang · Yingjuan Tang · Xu Gao · Xin Hao · Yifeng Shi · Yifeng Pan · Ning Sun · Juan Song · Jirui Yuan · Ping Luo · Zaiqing Nie

ViP3D: End-to-End Visual Trajectory Prediction via 3D Agent Queries

Junru Gu · Chenxu Hu · Tianyuan Zhang · Xuanyao Chen · Yilun Wang · Yue Wang · Hang Zhao

IPCC-TP: Utilizing Incremental Pearson Correlation Coefficient for Joint Multi-Agent Trajectory Prediction

Dekai Zhu · Guangyao Zhai · Yan Di · Fabian Manhardt · Hendrik Berkemeyer · Tuan Tran · Nassir Navab · Federico Tombari · Benjamin Busam

Leapfrog Diffusion Model for Stochastic Trajectory Prediction

Weibo Mao · Chenxin Xu · Qi Zhu · Siheng Chen · Yanfeng Wang

DeFeeNet: Consecutive 3D Human Motion Prediction With Deviation Feedback

Xiaoning Sun · Huaijiang Sun · Bin Li · Dong Wei · Weiqing Li · Jianfeng Lu

Self-Correctable and Adaptable Inference for Generalizable Human Pose Estimation

Zhehan Kan · Shuoshuo Chen · Ce Zhang · Yushun Tang · Zhihai He

ReDirTrans: Latent-to-Latent Translation for Gaze and Head Redirection

Shiwei Jin · Zhen Wang · Lei Wang · Ning Bi · Truong Nguyen

Feature Shrinkage Pyramid for Camouflaged Object Detection With Transformers

Zhou Huang · Hang Dai · Tian-Zhu Xiang · Shuo Wang · Huai-Xin Chen · Jie Qin · Huan Xiong

OVTrack: Open-Vocabulary Multiple Object Tracking

Siyuan Li · Tobias Fischer · Lei Ke · Henghui Ding · Martin Danelljan · Fisher Yu

GaitGCI: Generative Counterfactual Intervention for Gait Recognition

Huanzhang Dou · Pengyi Zhang · Wei Su · Yunlong Yu · Yining Lin · Xi Li

Multi-Label Compound Expression Recognition: C-EXPR Database & Network

Dimitrios Kollias

Blemish-Aware and Progressive Face Retouching With Limited Paired Data

Lianxin Xie · Wen Xue · Zhen Xu · Si Wu · Zhiwen Yu · Hau San Wong

High-Fidelity and Freely Controllable Talking Head Video Generation

Yue Gao · Yuan Zhou · Jinglu Wang · Xiao Li · Xiang Ming · Yan Lu

3Mformer: Multi-Order Multi-Mode Transformer for Skeletal Action Recognition

Lei Wang · Piotr Koniusz

UDE: A Unified Driving Engine for Human Motion Generation

Zixiang Zhou · Baoyuan Wang

Data-Driven Feature Tracking for Event Cameras

Nico Messikommer · Carter Fang · Mathias Gehrig · Davide Scaramuzza

MoStGAN-V: Video Generation With Temporal Motion Styles

Xiaoqian Shen · Xiang Li · Mohamed Elhoseiny

Two-Stage Co-Segmentation Network Based on Discriminative Representation for Recovering Human Mesh From Videos

Boyang Zhang · Kehua Ma · Suping Wu · Zhixiang Yuan

Joint Appearance and Motion Learning for Efficient Rolling Shutter Correction

Bin Fan · Yuxin Mao · Mochu Xiang · Zhexiong Wan · Qi Liu

Extracting Motion and Appearance via Inter-Frame Attention for Efficient Video Frame Interpolation

Guozhen Zhang · Yuhan Zhu · Haonan Wang · Youxin Chen · Gangshan Wu · Limin Wang

Deep Stereo Video Inpainting

Zhiliang Wu · Changchang Sun · Hanyu Xuan · Yan Yan

Burstormer: Burst Image Restoration and Enhancement Transformer

Akshay Dudhane · Syed Waqas Zamir · Salman Khan · Fahad Shahbaz Khan · Ming-Hsuan Yang

Blur Interpolation Transformer for Real-World Motion From Blur

Zhihang Zhong · Mingdeng Cao · Xiang Ji · Yinqiang Zheng · Imari Sato

HDR Imaging With Spatially Varying Signal-to-Noise Ratios

Yiheng Chi · Xingguang Zhang · Stanley H. Chan

Light Source Separation and Intrinsic Image Decomposition Under AC Illumination

Yusaku Yoshida · Ryo Kawahara · Takahiro Okabe

Physics-Guided ISO-Dependent Sensor Noise Modeling for Extreme Low-Light Photography

Yue Cao · Ming Liu · Shuai Liu · Xiaotao Wang · Lei Lei · Wangmeng Zuo

Neumann Network With Recursive Kernels for Single Image Defocus Deblurring

Yuhui Quan · Zicong Wu · Hui Ji

UMat: Uncertainty-Aware Single Image High Resolution Material Capture

Carlos Rodriguez-Pardo · Henar Domínguez-Elvira · David Pascual-Hernández · Elena Garces

SMAE: Few-Shot Learning for HDR Deghosting With Saturation-Aware Masked Autoencoders

Qingsen Yan · Song Zhang · Weiye Chen · Hao Tang · Yu Zhu · Jinqiu Sun · Luc Van Gool · Yanning Zhang

Curricular Contrastive Regularization for Physics-Aware Single Image Dehazing

Yu Zheng · Jiahui Zhan · Shengfeng He · Junyu Dong · Yong Du

Patch-Craft Self-Supervised Training for Correlated Image Denoising

Gregory Vaksman · Michael Elad

Spectral Enhanced Rectangle Transformer for Hyperspectral Image Denoising

Miaoyu Li · Ji Liu · Ying Fu · Yulun Zhang · Dejing Dou

All-in-One Image Restoration for Unknown Degradations Using Adaptive Discriminative Filters for Specific Degradations

Dongwon Park · Byung Hyun Lee · Se Young Chun

Ingredient-Oriented Multi-Degradation Learning for Image Restoration

Jinghao Zhang · Jie Huang · Mingde Yao · Zizheng Yang · Hu Yu · Man Zhou · Feng Zhao

CR-FIQA: Face Image Quality Assessment by Learning Sample Relative Classifiability

Fadi Boutros · Meiling Fang · Marcel Klemt · Biying Fu · Naser Damer

Re-IQA: Unsupervised Learning for Image Quality Assessment in the Wild

Avinab Saha · Sandeep Mishra · Alan C. Bovik

Toward Accurate Post-Training Quantization for Image Super Resolution

Zhijun Tu · Jie Hu · Hanting Chen · Yunhe Wang

Learning Steerable Function for Efficient Image Resampling

Jiacheng Li · Chang Chen · Wei Huang · Zhiqiang Lang · Fenglong Song · Youliang Yan · Zhiwei Xiong

ABCD: Arbitrary Bitwise Coefficient for De-Quantization

Woo Kyoung Han · Byeonghun Lee · Sang Hyun Park · Kyong Hwan Jin

Efficient Frequency Domain-Based Transformers for High-Quality Image Deblurring

Lingshun Kong · Jiangxin Dong · Jianjun Ge · Mingqiang Li · Jinshan Pan

Learning a Sparse Transformer Network for Effective Image Deraining

Xiang Chen · Hao Li · Mingqiang Li · Jinshan Pan

CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for Multi-Modality Image Fusion

Zixiang Zhao · Haowen Bai · Jiangshe Zhang · Yulun Zhang · Shuang Xu · Zudi Lin · Radu Timofte · Luc Van Gool

PCT-Net: Full Resolution Image Harmonization Using Pixel-Wise Color Transformations

Julian Jorge Andrade Guerreiro · Mitsuru Nakazawa · Björn Stenger

Semi-Supervised Parametric Real-World Image Harmonization

Ke Wang · Michaël Gharbi · He Zhang · Zhihao Xia · Eli Shechtman

Towards Robust Tampered Text Detection in Document Image: New Dataset and New Solution

Chenfan Qu · Chongyu Liu · Yuliang Liu · Xinhong Chen · Dezhi Peng · Fengjun Guo · Lianwen Jin

QuantArt: Quantizing Image Style Transfer Towards High Visual Fidelity

Siyu Huang · Jie An · Donglai Wei · Jiebo Luo · Hanspeter Pfister

Deep Curvilinear Editing: Commutative and Nonlinear Image Manipulation for Pretrained Deep Generative Model

Takehiro Aoshima · Takashi Matsubara

Person Image Synthesis via Denoising Diffusion Model

Ankan Kumar Bhunia · Salman Khan · Hisham Cholakkal · Rao Muhammad Anwer · Jorma Laaksonen · Mubarak Shah · Fahad Shahbaz Khan

Disentangling Writer and Character Styles for Handwriting Generation

Gang Dai · Yifan Zhang · Qingfeng Wang · Qing Du · Zhuliang Yu · Zhuoman Liu · Shuangping Huang

NoisyTwins: Class-Consistent and Diverse Image Generation Through StyleGANs

Harsh Rangwani · Lavish Bansal · Kartik Sharma · Tejan Karmali · Varun Jampani · R. Venkatesh Babu

High-Fidelity Guided Image Synthesis With Latent Diffusion Models

Jaskirat Singh · Stephen Gould · Liang Zheng

Imagic: Text-Based Real Image Editing With Diffusion Models

Bahjat Kawar · Shiran Zada · Oran Lang · Omer Tov · Huiwen Chang · Tali Dekel · Inbar Mosseri · Michal Irani

PosterLayout: A New Benchmark and Approach for Content-Aware Visual-Textual Presentation Layout

Hsiao Yuan Hsu · Xiangteng He · Yuxin Peng · Hao Kong · Qing Zhang

SINE: SINgle Image Editing With Text-to-Image Diffusion Models

Zhixing Zhang · Ligong Han · Arnab Ghosh · Dimitris N. Metaxas · Jian Ren

NULL-Text Inversion for Editing Real Images Using Guided Diffusion Models

Ron Mokady · Amir Hertz · Kfir Aberman · Yael Pritch · Daniel Cohen-Or

Diffusion Art or Digital Forgery? Investigating Data Replication in Diffusion Models

Gowthami Somepalli · Vasu Singla · Micah Goldblum · Jonas Geiping · Tom Goldstein

Parallel Diffusion Models of Operator and Image for Blind Inverse Problems

Hyungjin Chung · Jeongsol Kim · Sehui Kim · Jong Chul Ye

Unite and Conquer: Plug & Play Multi-Modal Synthesis Using Diffusion Models

Nithin Gopalakrishnan Nair · Wele Gedara Chaminda Bandara · Vishal M. Patel

Collaborative Diffusion for Multi-Modal Face Generation and Editing

Ziqi Huang · Kelvin C.K. Chan · Yuming Jiang · Ziwei Liu

Diffusion Video Autoencoders: Toward Temporally Consistent Face Video Editing via Disentangled Video Encoding

Gyeongman Kim · Hajin Shim · Hyunsu Kim · Yunjey Choi · Junho Kim · Eunho Yang

NVTC: Nonlinear Vector Transform Coding

Runsen Feng · Zongyu Guo · Weiping Li · Zhibo Chen

Motion Information Propagation for Neural Video Compression

Linfeng Qi · Jiahao Li · Bin Li · Houqiang Li · Yan Lu

A Dynamic Multi-Scale Voxel Flow Network for Video Prediction

Xiaotao Hu · Zhewei Huang · Ailin Huang · Jun Xu · Shuchang Zhou

Towards Scalable Neural Representation for Diverse Videos

Bo He · Xitong Yang · Hanyu Wang · Zuxuan Wu · Hao Chen · Shuaiyi Huang · Yixuan Ren · Ser-Nam Lim · Abhinav Shrivastava

DINER: Disorder-Invariant Implicit Neural Representation

Shaowen Xie · Hao Zhu · Zhen Liu · Qi Zhang · You Zhou · Xun Cao · Zhan Ma

SCConv: Spatial and Channel Reconstruction Convolution for Feature Redundancy

Jiafeng Li · Ying Wen · Lianghua He

DeepMAD: Mathematical Architecture Design for Deep Convolutional Neural Network

Xuan Shen · Yaohua Wang · Ming Lin · Yilun Huang · Hao Tang · Xiuyu Sun · Yanzhi Wang

Optimization-Inspired Cross-Attention Transformer for Compressive Sensing

Jiechong Song · Chong Mou · Shiqi Wang · Siwei Ma · Jian Zhang

Neighborhood Attention Transformer

Ali Hassani · Steven Walton · Jiachen Li · Shen Li · Humphrey Shi

Making Vision Transformers Efficient From a Token Sparsification View

Shuning Chang · Pichao Wang · Ming Lin · Fan Wang · David Junhao Zhang · Rong Jin · Mike Zheng Shou

Towards Efficient Use of Multi-Scale Features in Transformer-Based Object Detectors

Gongjie Zhang · Zhipeng Luo · Zichen Tian · Jingyi Zhang · Xiaoqin Zhang · Shijian Lu

Neuralizer: General Neuroimage Analysis Without Re-Training

Steffen Czolbe · Adrian V. Dalca

Learning Partial Correlation Based Deep Visual Representation for Image Classification

Saimunur Rahman · Piotr Koniusz · Lei Wang · Luping Zhou · Peyman Moghadam · Changming Sun

Understanding Masked Image Modeling via Learning Occlusion Invariant Feature

Xiangwen Kong · Xiangyu Zhang

MixMAE: Mixed and Masked Autoencoder for Efficient Pretraining of Hierarchical Vision Transformers

Jihao Liu · Xin Huang · Jinliang Zheng · Yu Liu · Hongsheng Li

Adaptive Graph Convolutional Subspace Clustering

Lai Wei · Zhengwei Chen · Jun Yin · Changming Zhu · Rigui Zhou · Jin Liu

Deep Learning of Partial Graph Matching via Differentiable Top-K

Runzhong Wang · Ziao Guo · Shaofei Jiang · Xiaokang Yang · Junchi Yan

DynamicDet: A Unified Dynamic Architecture for Object Detection

Zhihao Lin · Yongtao Wang · Jinhe Zhang · Xiaojie Chu

IS-GGT: Iterative Scene Graph Generation With Generative Transformers

Sanjoy Kundu · Sathyanarayanan N. Aakur

Fast Contextual Scene Graph Generation With Unbiased Context Augmentation

Tianlei Jin · Fangtai Guo · Qiwei Meng · Shiqiang Zhu · Xiangming Xi · Wen Wang · Zonghao Mu · Wei Song

Masked Video Distillation: Rethinking Masked Feature Modeling for Self-Supervised Video Representation Learning

Rui Wang · Dongdong Chen · Zuxuan Wu · Yinpeng Chen · Xiyang Dai · Mengchen Liu · Lu Yuan · Yu-Gang Jiang

MED-VT: Multiscale Encoder-Decoder Video Transformer With Application To Object Segmentation

Rezaul Karim · He Zhao · Richard P. Wildes · Mennatullah Siam

MOVES: Manipulated Objects in Video Enable Segmentation

Richard E. L. Higgins · David F. Fouhey

InstMove: Instance Motion for Object-Centric Video Segmentation

Qihao Liu · Junfeng Wu · Yi Jiang · Xiang Bai · Alan L. Yuille · Song Bai

ZBS: Zero-Shot Background Subtraction via Instance-Level Background Modeling and Foreground Selection

Yongqi An · Xu Zhao · Tao Yu · Haiyun Guo · Chaoyang Zhao · Ming Tang · Jinqiao Wang

Feature Aggregated Queries for Transformer-Based Video Object Detectors

Yiming Cui

Context-Aware Relative Object Queries To Unify Video Instance and Panoptic Segmentation

Anwesa Choudhuri · Girish Chowdhary · Alexander G. Schwing

Selective Structured State-Spaces for Long-Form Video Understanding

Jue Wang · Wentao Zhu · Pichao Wang · Xiang Yu · Linda Liu · Mohamed Omar · Raffay Hamid

Relational Space-Time Query in Long-Form Videos

Xitong Yang · Fu-Jen Chu · Matt Feiszli · Raghav Goyal · Lorenzo Torresani · Du Tran

Novel-View Acoustic Synthesis

Changan Chen · Alexander Richard · Roman Shapovalov · Vamsi Krishna Ithapu · Natalia Neverova · Kristen Grauman · Andrea Vedaldi

Learning Audio-Visual Source Localization via False Negative Aware Contrastive Learning

Weixuan Sun · Jiayi Zhang · Jianyuan Wang · Zheyuan Liu · Yiran Zhong · Tianpeng Feng · Yandong Guo · Yanhao Zhang · Nick Barnes

Sound to Visual Scene Generation by Audio-to-Visual Latent Alignment

Kim Sung-Bin · Arda Senocak · Hyunwoo Ha · Andrew Owens · Tae-Hyun Oh

CASP-Net: Rethinking Video Saliency Prediction From an Audio-Visual Consistency Perceptual Perspective

Junwen Xiong · Ganglai Wang · Peng Zhang · Wei Huang · Yufei Zha · Guangtao Zhai

Decompose More and Aggregate Better: Two Closer Looks at Frequency Representation Learning for Human Motion Prediction

Xuehao Gao · Shaoyi Du · Yang Wu · Yang Yang

TempSAL – Uncovering Temporal Information for Deep Saliency Prediction

Bahar Aydemir · Ludo Hoffstetter · Tong Zhang · Mathieu Salzmann · Sabine Süsstrunk

Prompt-Guided Zero-Shot Anomaly Action Recognition Using Pretrained Deep Skeleton Features

Fumiaki Sato · Ryo Hachiuma · Taiki Sekii

MMG-Ego4D: Multimodal Generalization in Egocentric Action Recognition

Xinyu Gong · Sreyas Mohan · Naina Dhingra · Jean-Charles Bazin · Yilei Li · Zhangyang Wang · Rakesh Ranjan

Active Exploration of Multimodal Complementarity for Few-Shot Action Recognition

Yuyang Wanyan · Xiaoshan Yang · Chaofan Chen · Changsheng Xu

Reducing the Label Bias for Timestamp Supervised Temporal Action Segmentation

Kaiyuan Liu · Yunheng Li · Shenglan Liu · Chenwei Tan · Zihang Shao

Soft-Landing Strategy for Alleviating the Task Discrepancy Problem in Temporal Action Localization Tasks

Hyolim Kang · Hanjung Kim · Joungbin An · Minsu Cho · Seon Joo Kim

Iterative Proposal Refinement for Weakly-Supervised Video Grounding

Meng Cao · Fangyun Wei · Can Xu · Xiubo Geng · Long Chen · Can Zhang · Yuexian Zou · Tao Shen · Daxin Jiang

Movies2Scenes: Using Movie Metadata To Learn Scene Representation

Shixing Chen · Chun-Hao Liu · Xiang Hao · Xiaohan Nie · Maxim Arap · Raffay Hamid

Fine-Tuned CLIP Models Are Efficient Video Learners

Hanoona Rasheed · Muhammad Uzair Khattak · Muhammad Maaz · Salman Khan · Fahad Shahbaz Khan

Revisiting Temporal Modeling for CLIP-Based Image-to-Video Knowledge Transferring

Ruyang Liu · Jingjia Huang · Ge Li · Jiashi Feng · Xinglong Wu · Thomas H. Li

VoP: Text-Video Co-Operative Prompt Tuning for Cross-Modal Retrieval

Siteng Huang · Biao Gong · Yulin Pan · Jianwen Jiang · Yiliang Lv · Yuyuan Li · Donglin Wang

ProTéGé: Untrimmed Pretraining for Video Temporal Grounding by Video Temporal Grounding

Lan Wang · Gaurav Mittal · Sandra Sajeev · Ye Yu · Matthew Hall · Vishnu Naresh Boddeti · Mei Chen

Learning Video Representations From Large Language Models

Yue Zhao · Ishan Misra · Philipp Krähenbühl · Rohit Girdhar

All in One: Exploring Unified Video-Language Pre-Training

Jinpeng Wang · Yixiao Ge · Rui Yan · Yuying Ge · Kevin Qinghong Lin · Satoshi Tsutsui · Xudong Lin · Guanyu Cai · Jianping Wu · Ying Shan · Xiaohu Qie · Mike Zheng Shou

High-Fidelity Generalized Emotional Talking Face Generation With Multi-Modal Emotion Space Learning

Chao Xu · Junwei Zhu · Jiangning Zhang · Yue Han · Wenqing Chu · Ying Tai · Chengjie Wang · Zhifeng Xie · Yong Liu

Bidirectional Cross-Modal Knowledge Exploration for Video Recognition With Pre-Trained Vision-Language Models

Wenhao Wu · Xiaohan Wang · Haipeng Luo · Jingdong Wang · Yi Yang · Wanli Ouyang

Decoupled Multimodal Distilling for Emotion Recognition

Yong Li · Yuanzhi Wang · Zhen Cui

Affection: Learning Affective Explanations for Real-World Visual Data

Panos Achlioptas · Maks Ovsjanikov · Leonidas Guibas · Sergey Tulyakov

An Actor-Centric Causality Graph for Asynchronous Temporal Inference in Group Activity

Zhao Xie · Tian Gao · Kewei Wu · Jiao Chang

VLPD: Context-Aware Pedestrian Detection via Vision-Language Semantic Self-Supervision

Mengyin Liu · Jie Jiang · Chao Zhu · Xu-Cheng Yin

3D-Aware Object Goal Navigation via Simultaneous Exploration and Identification

Jiazhao Zhang · Liu Dai · Fanpeng Meng · Qingnan Fan · Xuelin Chen · Kai Xu · He Wang

Meta-Explore: Exploratory Hierarchical Vision-and-Language Navigation Using Scene Object Spectrum Grounding

Minyoung Hwang · Jaeyeon Jeong · Minsoo Kim · Yoonseon Oh · Songhwai Oh

NaQ: Leveraging Narrations As Queries To Supervise Episodic Memory

Santhosh Kumar Ramakrishnan · Ziad Al-Halah · Kristen Grauman

EC2: Emergent Communication for Embodied Control

Yao Mu · Shunyu Yao · Mingyu Ding · Ping Luo · Chuang Gan

Abstract Visual Reasoning: An Algebraic Approach for Solving Raven’s Progressive Matrices

Jingyi Xu · Tushar Vaidya · Yufei Wu · Saket Chandra · Zhangsheng Lai · Kai Fong Ernest Chong

Logical Implications for Visual Question Answering Consistency

Sergio Tascon-Morales · Pablo Márquez-Neila · Raphael Sznitman

Divide and Conquer: Answering Questions With Object Factorization and Compositional Reasoning

Shi Chen · Qi Zhao

The Dialog Must Go On: Improving Visual Dialog via Generative Self-Training

Gi-Cheon Kang · Sungdong Kim · Jin-Hwa Kim · Donghyun Kwak · Byoung-Tak Zhang

Visual-Language Prompt Tuning With Knowledge-Guided Context Optimization

Hantao Yao · Rui Zhang · Changsheng Xu

Probabilistic Prompt Learning for Dense Prediction

Hyeongjun Kwon · Taeyong Song · Somi Jeong · Jin Kim · Jinhyun Jang · Kwanghoon Sohn

Is BERT Blind? Exploring the Effect of Vision-and-Language Pretraining on Visual Language Understanding

Morris Alper · Michael Fiman · Hadar Averbuch-Elor

Seeing What You Miss: Vision-Language Pre-Training With Semantic Completion Learning

Yatai Ji · Rongcheng Tu · Jie Jiang · Weijie Kong · Chengfei Cai · Wenzhe Zhao · Hongfa Wang · Yujiu Yang · Wei Liu

Affordance Grounding From Demonstration Video To Target Image

Joya Chen · Difei Gao · Kevin Qinghong Lin · Mike Zheng Shou

Leverage Interactive Affinity for Affordance Learning

Hongchen Luo · Wei Zhai · Jing Zhang · Yang Cao · Dacheng Tao

DeAR: Debiasing Vision-Language Models With Additive Residuals

Ashish Seth · Mayur Hemani · Chirag Agarwal

Images Speak in Images: A Generalist Painter for In-Context Visual Learning

Xinlong Wang · Wen Wang · Yue Cao · Chunhua Shen · Tiejun Huang

Hyperbolic Contrastive Learning for Visual Representations Beyond Objects

Songwei Ge · Shlok Mishra · Simon Kornblith · Chun-Liang Li · David Jacobs

Picture That Sketch: Photorealistic Image Generation From Abstract Sketches

Subhadeep Koley · Ayan Kumar Bhunia · Aneeshan Sain · Pinaki Nath Chowdhury · Tao Xiang · Yi-Zhe Song

GeneCIS: A Benchmark for General Conditional Image Similarity

Sagar Vaze · Nicolas Carion · Ishan Misra

Exploiting Unlabelled Photos for Stronger Fine-Grained SBIR

Aneeshan Sain · Ayan Kumar Bhunia · Subhadeep Koley · Pinaki Nath Chowdhury · Soumitri Chattopadhyay · Tao Xiang · Yi-Zhe Song

Parts2Words: Learning Joint Embedding of Point Clouds and Texts by Bidirectional Matching Between Parts and Words

Chuan Tang · Xi Yang · Bojian Wu · Zhizhong Han · Yi Chang

DeltaEdit: Exploring Text-Free Training for Text-Driven Image Manipulation

Yueming Lyu · Tianwei Lin · Fu Li · Dongliang He · Jing Dong · Tieniu Tan

Detecting and Grounding Multi-Modal Media Manipulation

Rui Shao · Tianxing Wu · Ziwei Liu

Positive-Augmented Contrastive Learning for Image and Video Captioning Evaluation

Sara Sarto · Manuele Barraco · Marcella Cornia · Lorenzo Baraldi · Rita Cucchiara

Similarity Maps for Self-Training Weakly-Supervised Phrase Grounding

Tal Shaharabany · Lior Wolf

Cross-Domain Image Captioning With Discriminative Finetuning

Roberto Dessì · Michele Bevilacqua · Eleonora Gualdoni · Nathanaël Carraz Rakotonirina · Francesca Franzon · Marco Baroni

EXIF As Language: Learning Cross-Modal Associations Between Images and Camera Metadata

Chenhao Zheng · Ayush Shrivastava · Andrew Owens

Uncurated Image-Text Datasets: Shedding Light on Demographic Bias

Noa Garcia · Yusuke Hirota · Yankun Wu · Yuta Nakashima

Filtering, Distillation, and Hard Negatives for Vision-Language Pre-Training

Filip Radenovic · Abhimanyu Dubey · Abhishek Kadian · Todor Mihaylov · Simon Vandenhende · Yash Patel · Yi Wen · Vignesh Ramanathan · Dhruv Mahajan

Turning a CLIP Model Into a Scene Text Detector

Wenwen Yu · Yuliang Liu · Wei Hua · Deqiang Jiang · Bo Ren · Xiang Bai

ScanDMM: A Deep Markov Model of Scanpath Prediction for 360° Images

Xiangjie Sui · Yuming Fang · Hanwei Zhu · Shiqi Wang · Zhou Wang

CrOC: Cross-View Online Clustering for Dense Visual Representation Learning

Thomas Stegmüller · Tim Lebailly · Behzad Bozorgtabar · Tinne Tuytelaars · Jean-Philippe Thiran

PLA: Language-Driven Open-Vocabulary 3D Scene Understanding

Runyu Ding · Jihan Yang · Chuhui Xue · Wenqing Zhang · Song Bai · Xiaojuan Qi

CLIP2Scene: Towards Label-Efficient 3D Scene Understanding by CLIP

Runnan Chen · Youquan Liu · Lingdong Kong · Xinge Zhu · Yuexin Ma · Yikang Li · Yuenan Hou · Yu Qiao · Wenping Wang

CORA: Adapting CLIP for Open-Vocabulary Detection With Region Prompting and Anchor Pre-Matching

Xiaoshi Wu · Feng Zhu · Rui Zhao · Hongsheng Li

Open-Vocabulary Attribute Detection

María A. Bravo · Sudhanshu Mittal · Simon Ging · Thomas Brox

Learning To Detect and Segment for Open Vocabulary Object Detection

Tao Wang

Open-Vocabulary Semantic Segmentation With Mask-Adapted CLIP

Feng Liang · Bichen Wu · Xiaoliang Dai · Kunpeng Li · Yinan Zhao · Hang Zhang · Peizhao Zhang · Peter Vajda · Diana Marculescu

A Simple Framework for Text-Supervised Semantic Segmentation

Muyang Yi · Quan Cui · Hao Wu · Cheng Yang · Osamu Yoshie · Hongtao Lu

GAPartNet: Cross-Category Domain-Generalizable Object Perception and Manipulation via Generalizable and Actionable Parts

Haoran Geng · Helin Xu · Chengyang Zhao · Chao Xu · Li Yi · Siyuan Huang · He Wang

GeoLayoutLM: Geometric Pre-Training for Visual Information Extraction

Chuwei Luo · Changxu Cheng · Qi Zheng · Cong Yao

Self-Supervised Image-to-Point Distillation via Semantically Tolerant Contrastive Loss

Anas Mahmoud · Jordan S. K. Hu · Tianshu Kuai · Ali Harakeh · Liam Paull · Steven L. Waslander

Generative Semantic Segmentation

Jiaqi Chen · Jiachen Lu · Xiatian Zhu · Li Zhang

MISC210K: A Large-Scale Dataset for Multi-Instance Semantic Correspondence

Yixuan Sun · Yiwen Huang · Haijing Guo · Yuzhou Zhao · Runmin Wu · Yizhou Yu · Weifeng Ge · Wenqiang Zhang

MIANet: Aggregating Unbiased Instance and General Information for Few-Shot Semantic Segmentation

Yong Yang · Qiong Chen · Yuan Feng · Tianlin Huang

PACO: Parts and Attributes of Common Objects

Vignesh Ramanathan · Anmol Kalia · Vladan Petrovic · Yi Wen · Baixue Zheng · Baishan Guo · Rui Wang · Aaron Marquez · Rama Kovvuri · Abhishek Kadian · Amir Mousavi · Yiwen Song · Abhimanyu Dubey · Dhruv Mahajan

PartDistillation: Learning Parts From Instance Segmentation

Jang Hyun Cho · Philipp Krähenbühl · Vignesh Ramanathan

ACSeg: Adaptive Conceptualization for Unsupervised Semantic Segmentation

Kehan Li · Zhennan Wang · Zesen Cheng · Runyi Yu · Yian Zhao · Guoli Song · Chang Liu · Li Yuan · Jie Chen

Reliability in Semantic Segmentation: Are We on the Right Track?

Pau de Jorge · Riccardo Volpi · Philip H.S. Torr · Grégory Rogez

Rethinking the Correlation in Few-Shot Segmentation: A Buoys View

Yuan Wang · Rui Sun · Tianzhu Zhang

SIM: Semantic-Aware Instance Mask Generation for Box-Supervised Instance Segmentation

Ruihuang Li · Chenhang He · Yabin Zhang · Shuai Li · Liyi Chen · Lei Zhang

Endpoints Weight Fusion for Class Incremental Semantic Segmentation

Jia-Wen Xiao · Chang-Bin Zhang · Jiekang Feng · Xialei Liu · Joost van de Weijer · Ming-Ming Cheng

Incrementer: Transformer for Class-Incremental Semantic Segmentation With Knowledge Distillation Focusing on Old Class

Chao Shang · Hongliang Li · Fanman Meng · Qingbo Wu · Heqian Qiu · Lanxiao Wang

Continuous Pseudo-Label Rectified Domain Adaptive Semantic Segmentation With Implicit Neural Representations

Rui Gong · Qin Wang · Martin Danelljan · Dengxin Dai · Luc Van Gool

Revisiting Weak-to-Strong Consistency in Semi-Supervised Semantic Segmentation

Lihe Yang · Lei Qi · Litong Feng · Wayne Zhang · Yinghuan Shi

Discriminative Co-Saliency and Background Mining Transformer for Co-Salient Object Detection

Long Li · Junwei Han · Ni Zhang · Nian Liu · Salman Khan · Hisham Cholakkal · Rao Muhammad Anwer · Fahad Shahbaz Khan

Texture-Guided Saliency Distilling for Unsupervised Salient Object Detection

Huajun Zhou · Bo Qiao · Lingxiao Yang · Jianhuang Lai · Xiaohua Xie

An Erudite Fine-Grained Visual Classification Model

Dongliang Chang · Yujun Tong · Ruoyi DU · Timothy Hospedales · Yi-Zhe Song · Zhanyu Ma

Dynamic Graph Learning With Content-Guided Spatial-Frequency Relation Reasoning for Deepfake Detection

Yuan Wang · Kun Yu · Chen Chen · Xiyuan Hu · Silong Peng

ScaleDet: A Scalable Multi-Dataset Object Detector

Yanbei Chen · Manchen Wang · Abhay Mittal · Zhenlin Xu · Paolo Favaro · Joseph Tighe · Davide Modolo

Multi-Centroid Task Descriptor for Dynamic Class Incremental Inference

Tenghao Cai · Zhizhong Zhang · Xin Tan · Yanyun Qu · Guannan Jiang · Chengjie Wang · Yuan Xie

Matching Is Not Enough: A Two-Stage Framework for Category-Agnostic Pose Estimation

Min Shi · Zihao Huang · Xianzheng Ma · Xiaowei Hu · Zhiguo Cao

Dynamic Coarse-To-Fine Learning for Oriented Tiny Object Detection

Chang Xu · Jian Ding · Jinwang Wang · Wen Yang · Huai Yu · Lei Yu · Gui-Song Xia

Dense Distinct Query for End-to-End Object Detection

Shilong Zhang · Xinjiang Wang · Jiaqi Wang · Jiangmiao Pang · Chengqi Lyu · Wenwei Zhang · Ping Luo · Kai Chen

Meta-Tuning Loss Functions and Data Augmentation for Few-Shot Object Detection

Berkan Demirel · Orhun Buğra Baran · Ramazan Gokberk Cinbis

One-to-Few Label Assignment for End-to-End Dense Detection

Shuai Li · Minghan Li · Ruihuang Li · Chenhang He · Lei Zhang

Test Time Adaptation With Regularized Loss for Weakly Supervised Salient Object Detection

Olga Veksler

MixTeacher: Mining Promising Labels With Mixed Scale Teacher for Semi-Supervised Object Detection

Liang Liu · Boshen Zhang · Jiangning Zhang · Wuhao Zhang · Zhenye Gan · Guanzhong Tian · Wenbing Zhu · Yabiao Wang · Chengjie Wang

Exploring Incompatible Knowledge Transfer in Few-Shot Image Generation

Yunqing Zhao · Chao Du · Milad Abdollahzadeh · Tianyu Pang · Min Lin · Shuicheng Yan · Ngai-Man Cheung

Exploring Intra-Class Variation Factors With Learnable Cluster Prompts for Semi-Supervised Image Synthesis

Yunfei Zhang · Xiaoyang Huo · Tianyi Chen · Si Wu · Hau San Wong

A Soma Segmentation Benchmark in Full Adult Fly Brain

Xiaoyu Liu · Bo Hu · Mingxing Li · Wei Huang · Yueyi Zhang · Zhiwei Xiong

SDC-UDA: Volumetric Unsupervised Domain Adaptation Framework for Slice-Direction Continuous Cross-Modality Medical Image Segmentation

Hyungseob Shin · Hyeongyu Kim · Sewon Kim · Yohan Jun · Taejoon Eo · Dosik Hwang

Label-Free Liver Tumor Segmentation

Qixin Hu · Yixiong Chen · Junfei Xiao · Shuwen Sun · Jieneng Chen · Alan L. Yuille · Zongwei Zhou

Interactive and Explainable Region-Guided Radiology Report Generation

Tim Tanida · Philip Müller · Georgios Kaissis · Daniel Rueckert

A Loopback Network for Explainable Microvascular Invasion Classification

Shengxuming Zhang · Tianqi Shi · Yang Jiang · Xiuming Zhang · Jie Lei · Zunlei Feng · Mingli Song

Task-Specific Fine-Tuning via Variational Information Bottleneck for Weakly-Supervised Pathology Whole Slide Image Classification

Honglin Li · Chenglu Zhu · Yunlong Zhang · Yuxuan Sun · Zhongyi Shui · Wenwei Kuang · Sunyi Zheng · Lin Yang

YOLOv7: Trainable Bag-of-Freebies Sets New State-of-the-Art for Real-Time Object Detectors

Chien-Yao Wang · Alexey Bochkovskiy · Hong-Yuan Mark Liao

Two-Way Multi-Label Loss

Takumi Kobayashi

Teaching Matters: Investigating the Role of Supervision in Vision Transformers

Matthew Walmer · Saksham Suri · Kamal Gupta · Abhinav Shrivastava

Detection of Out-of-Distribution Samples Using Binary Neuron Activation Patterns

Bartłomiej Olber · Krystian Radlak · Adam Popowicz · Michal Szczepankiewicz · Krystian Chachuła

Label Information Bottleneck for Label Enhancement

Qinghai Zheng · Jihua Zhu · Haoyu Tang

Glocal Energy-Based Learning for Few-Shot Open-Set Recognition

Haoyu Wang · Guansong Pang · Peng Wang · Lei Zhang · Wei Wei · Yanning Zhang

Noisy Correspondence Learning With Meta Similarity Correction

Haochen Han · Kaiyao Miao · Qinghua Zheng · Minnan Luo

Hubs and Hyperspheres: Reducing Hubness and Improving Transductive Few-Shot Learning With Hyperspherical Embeddings

Daniel J. Trosten · Rwiddhi Chakraborty · Sigurd Løkse · Kristoffer Knutsen Wickstrøm · Robert Jenssen · Michael C. Kampffmeyer

Coreset Sampling From Open-Set for Fine-Grained Self-Supervised Learning

Sungnyun Kim · Sangmin Bae · Se-Young Yun

Boosting Semi-Supervised Learning by Exploiting All Unlabeled Data

Yuhao Chen · Xin Tan · Borui Zhao · Zhaowei Chen · Renjie Song · Jiajun Liang · Xuequan Lu

Trade-Off Between Robustness and Accuracy of Vision Transformers

Yanxi Li · Chang Xu

Exploring and Utilizing Pattern Imbalance

Shibin Mei · Chenglong Zhao · Shengchao Yuan · Bingbing Ni

Dynamic Conceptional Contrastive Learning for Generalized Category Discovery

Nan Pu · Zhun Zhong · Nicu Sebe

Towards Better Decision Forests: Forest Alternating Optimization

Miguel Á. Carreira-Perpiñán · Magzhan Gabidolla · Arman Zharmagambetov

Learning Debiased Representations via Conditional Attribute Interpolation

Yi-Kai Zhang · Qi-Wei Wang · De-Chuan Zhan · Han-Jia Ye

On the Pitfall of Mixup for Uncertainty Calibration

Deng-Bao Wang · Lanqing Li · Peilin Zhao · Pheng-Ann Heng · Min-Ling Zhang

Class Relationship Embedded Learning for Source-Free Unsupervised Domain Adaptation

Yixin Zhang · Zilei Wang · Weinan He

FeatureBooster: Boosting Feature Descriptors With a Lightweight Neural Network

Xinjiang Wang · Zeyu Liu · Yu Hu · Wei Xi · Wenxian Yu · Danping Zou

Guiding Pseudo-Labels With Uncertainty Estimation for Source-Free Unsupervised Domain Adaptation

Mattia Litrico · Alessio Del Bue · Pietro Morerio

Divide and Adapt: Active Domain Adaptation via Customized Learning

Duojun Huang · Jichang Li · Weikai Chen · Junshi Huang · Zhenhua Chai · Guanbin Li

Understanding and Constructing Latent Modality Structures in Multi-Modal Representation Learning

Qian Jiang · Changyou Chen · Han Zhao · Liqun Chen · Qing Ping · Son Dinh Tran · Yi Xu · Belinda Zeng · Trishul Chilimbi

Deep Factorized Metric Learning

Chengkun Wang · Wenzhao Zheng · Junlong Li · Jie Zhou · Jiwen Lu

Meta-Causal Learning for Single Domain Generalization

Jin Chen · Zhi Gao · Xinxiao Wu · Jiebo Luo

Meta Omnium: A Benchmark for General-Purpose Learning-To-Learn

Ondrej Bohdal · Yinbing Tian · Yongshuo Zong · Ruchika Chavhan · Da Li · Henry Gouk · Li Guo · Timothy Hospedales

Robust Mean Teacher for Continual and Gradual Test-Time Adaptation

Mario Döbler · Robert A. Marsden · Bin Yang

NAR-Former: Neural Architecture Representation Learning Towards Holistic Attributes Prediction

Yun Yi · Haokui Zhang · Wenze Hu · Nannan Wang · Xiaoyu Wang

Visual Query Tuning: Towards Effective Usage of Intermediate Representations for Parameter and Memory Efficient Transfer Learning

Cheng-Hao Tu · Zheda Mai · Wei-Lun Chao

Architecture, Dataset and Model-Scale Agnostic Data-Free Meta-Learning

Zixuan Hu · Li Shen · Zhenyi Wang · Tongliang Liu · Chun Yuan · Dacheng Tao

GKEAL: Gaussian Kernel Embedded Analytic Learning for Few-Shot Class Incremental Task

Huiping Zhuang · Zhenyu Weng · Run He · Zhiping Lin · Ziqian Zeng

Mitigating Task Interference in Multi-Task Learning via Explicit Task Routing With Non-Learnable Primitives

Chuntao Ding · Zhichao Lu · Shangguang Wang · Ran Cheng · Vishnu Naresh Boddeti

Boundary Unlearning: Rapid Forgetting of Deep Networks via Shifting the Decision Boundary

Min Chen · Weizhuo Gao · Gaoyang Liu · Kai Peng · Chen Wang

Task Difficulty Aware Parameter Allocation & Regularization for Lifelong Learning

Wenjin Wang · Yunqing Hu · Qianglong Chen · Yin Zhang

Learning To Retain While Acquiring: Combating Distribution-Shift in Adversarial Data-Free Knowledge Distillation

Gaurav Patel · Konda Reddy Mopuri · Qiang Qiu

A Unified Knowledge Distillation Framework for Deep Directed Graphical Models

Yizhuo Chen · Kaizhao Liang · Zhe Zeng · Shuochao Yao · Huajie Shao

Coaching a Teachable Student

Jimuyang Zhang · Zanming Huang · Eshed Ohn-Bar

Adaptive Plasticity Improvement for Continual Learning

Yan-Shuo Liang · Wu-Jun Li

Improving Generalization of Meta-Learning With Inverted Regularization at Inner-Level

Lianzhe Wang · Shiji Zhou · Shanghang Zhang · Xu Chu · Heng Chang · Wenwu Zhu

Trainable Projected Gradient Method for Robust Fine-Tuning

Junjiao Tian · Zecheng He · Xiaoliang Dai · Chih-Yao Ma · Yen-Cheng Liu · Zsolt Kira

Imitation Learning As State Matching via Differentiable Physics

Siwei Chen · Xiao Ma · Zhongwen Xu

Improved Distribution Matching for Dataset Condensation

Ganlong Zhao · Guanbin Li · Yipeng Qin · Yizhou Yu

A General Regret Bound of Preconditioned Gradient Method for DNN Training

Hongwei Yong · Ying Sun · Lei Zhang

From Node Interaction To Hop Interaction: New Effective and Scalable Graph Learning Paradigm

Jie Chen · Zilong Li · Yin Zhu · Junping Zhang · Jian Pu

Constructing Deep Spiking Neural Networks From Artificial Neural Networks With Knowledge Distillation

Qi Xu · Yaxin Li · Jiangrong Shen · Jian K. Liu · Huajin Tang · Gang Pan

Rate Gradient Approximation Attack Threats Deep Spiking Neural Networks

Tong Bu · Jianhao Ding · Zecheng Hao · Zhaofei Yu

MobileOne: An Improved One Millisecond Mobile Backbone

Pavan Kumar Anasosalu Vasu · James Gabriel · Jeff Zhu · Oncel Tuzel · Anurag Ranjan

Understanding Masked Autoencoders via Hierarchical Latent Variable Models

Lingjing Kong · Martin Q. Ma · Guangyi Chen · Eric P. Xing · Yuejie Chi · Louis-Philippe Morency · Kun Zhang

Training Debiased Subnetworks With Contrastive Weight Pruning

Geon Yeong Park · Sangmin Lee · Sang Wan Lee · Jong Chul Ye

One-Shot Model for Mixed-Precision Quantization

Ivan Koryakovskiy · Alexandra Yakovleva · Valentin Buchnev · Temur Isaev · Gleb Odinokikh

Solving Oscillation Problem in Post-Training Quantization Through a Theoretical Perspective

Yuexiao Ma · Huixia Li · Xiawu Zheng · Xuefeng Xiao · Rui Wang · Shilei Wen · Xin Pan · Fei Chao · Rongrong Ji

Adaptive Data-Free Quantization

Biao Qian · Yang Wang · Richang Hong · Meng Wang

Learning To Generate Image Embeddings With User-Level Differential Privacy

Zheng Xu · Maxwell Collins · Yuxiao Wang · Liviu Panait · Sewoong Oh · Sean Augenstein · Ting Liu · Florian Schroff · H. Brendan McMahan

Cross-GAN Auditing: Unsupervised Identification of Attribute Level Similarities and Differences Between Pretrained Generative Models

Matthew L. Olson · Shusen Liu · Rushil Anirudh · Jayaraman J. Thiagarajan · Peer-Timo Bremer · Weng-Keen Wong

HandsOff: Labeled Dataset Generation With No Additional Human Annotations

Austin Xu · Mariya I. Vasileva · Achal Dave · Arjun Seshadri

Attribute-Preserving Face Dataset Anonymization via Latent Code Optimization

Simone Barattin · Christos Tzelepis · Ioannis Patras · Nicu Sebe

Fake It Till You Make It: Learning Transferable Representations From Synthetic ImageNet Clones

Mert Bülent Sarıyıldız · Karteek Alahari · Diane Larlus · Yannis Kalantidis

Unbiased Multiple Instance Learning for Weakly Supervised Video Anomaly Detection

Hui Lv · Zhongqi Yue · Qianru Sun · Bin Luo · Zhen Cui · Hanwang Zhang

Multimodal Industrial Anomaly Detection via Hybrid Fusion

Yue Wang · Jinlong Peng · Jiangning Zhang · Ran Yi · Yabiao Wang · Chengjie Wang

FedSeg: Class-Heterogeneous Federated Learning for Semantic Segmentation

Jiaxu Miao · Zongxin Yang · Leilei Fan · Yi Yang

Decentralized Learning With Multi-Headed Distillation

Andrey Zhmoginov · Mark Sandler · Nolan Miller · Gus Kristiansen · Max Vladymyrov

Learning Federated Visual Prompt in Null Space for MRI Reconstruction

Chun-Mei Feng · Bangjun Li · Xinxing Xu · Yong Liu · Huazhu Fu · Wangmeng Zuo

Federated Learning With Data-Agnostic Distribution Fusion

Jian-hui Duan · Wenzhong Li · Derun Zou · Ruichen Li · Sanglu Lu

CaPriDe Learning: Confidential and Private Decentralized Learning Based on Encryption-Friendly Distillation Loss

Nurbek Tastan · Karthik Nandakumar

RiDDLE: Reversible and Diversified De-Identification With Latent Encryptor

Dongze Li · Wei Wang · Kang Zhao · Jing Dong · Tieniu Tan

Multi-View Adversarial Discriminator: Mine the Non-Causal Factors for Object Detection in Unseen Domains

Mingjun Xu · Lingyun Qin · Weijie Chen · Shiliang Pu · Lei Zhang

Single Image Backdoor Inversion via Robust Smoothed Classifiers

Mingjie Sun · Zico Kolter

Effective Ambiguity Attack Against Passport-Based DNN Intellectual Property Protection Schemes Through Fully Connected Layer Substitution

Yiming Chen · Jinyu Tian · Xiangyu Chen · Jiantao Zhou

Color Backdoor: A Robust Poisoning Attack in Color Space

Wenbo Jiang · Hongwei Li · Guowen Xu · Tianwei Zhang

Adversarially Robust Neural Architecture Search for Graph Neural Networks

Beini Xie · Heng Chang · Ziwei Zhang · Xin Wang · Daixin Wang · Zhiqiang Zhang · Rex Ying · Wenwu Zhu

Minimizing Maximum Model Discrepancy for Transferable Black-Box Targeted Attacks

Anqi Zhao · Tong Chu · Yahao Liu · Wen Li · Jingjing Li · Lixin Duan

StyLess: Boosting the Transferability of Adversarial Examples

Kaisheng Liang · Bin Xiao

Improving the Transferability of Adversarial Samples by Path-Augmented Method

Jianping Zhang · Jen-tse Huang · Wenxuan Wang · Yichen Li · Weibin Wu · Xiaosen Wang · Yuxin Su · Michael R. Lyu

Feature Separation and Recalibration for Adversarial Robustness

Woo Jae Kim · Yoonki Cho · Junsik Jung · Sung-Eui Yoon

CFA: Class-Wise Calibrated Fair Adversarial Training

Zeming Wei · Yifei Wang · Yiwen Guo · Yisen Wang

Revisiting Residual Networks for Adversarial Robustness

Shihua Huang · Zhichao Lu · Kalyanmoy Deb · Vishnu Naresh Boddeti

Privacy-Preserving Adversarial Facial Features

Zhibo Wang · He Wang · Shuaifan Jin · Wenwen Zhang · Jiahui Hu · Yan Wang · Peng Sun · Wei Yuan · Kaixin Liu · Kui Ren

Edge-Aware Regional Message Passing Controller for Image Forgery Localization

Dong Li · Jiaying Zhu · Menglu Wang · Jiawei Liu · Xueyang Fu · Zheng-Jun Zha

Go to Event Page

Social

Diversity and Inclusion Social

Jiawei He · Katerina Fragkiadaki · Vikram V. Ramaswamy

7:00 PM - 9:00 PM

Diversity and inclusion are crucial for driving organizational impact in both academia and industry. To foster an environment that respects and cherishes a culture of inclusion and belonging, we propose organizing a social event that connects diversity and inclusion (D&I) initiatives with people attending CVPR. The goal of this event is to raise awareness and build connections among CVPR attendees who are interested in participating in or creating D&I initiatives. We believe that by bringing together organizations such as AI4ALL, Women in Computer Vision, CIFAR, Let’s SOLVE it from Borealis AI, etc., this social event can serve as a bridge between different organizations and promote future collaborations.

... more

Social

How to Negotiate Industry Offers in AI proposal

Nicole Bannon · Sameer Saddiqi

7:00 PM - 9:00 PM

Join our social event to get the tools, information, and data you need to negotiate your next offer more confidently. Some of the topics we'll cover in a 2 hour period (including 45 mins for Q&A) are: Understanding the fundamentals of compensation in tech (particularly around equity, - bonus structures, etc.), data points for different levels/positions in AI, how to get over your fears of negotiating, how to decide which company / offer is right for you, how to negotiate without counter offers and without knowing "market value", how to respond to pushback from recruiters and other guilt tripping / lowballing / pressure tactics, how to avoid having an offer rescinded, how to negotiate deadline of an offer and walking through a timeline of the negotiation process for a new offer.

... more

Social

AMA with Senior Faculty and Industry Leaders

Yong Hee Lee

7:00 PM - 9:00 PM

This is a casual networking event for graduate students, faculty members, and industry professionals. There will be standing tables, light food, and drinks provided by the event sponsors. Students will have a chance to connect with fellow graduate students and mentors from various backgrounds, at a variety of stages throughout their careers.

... more

Social

Black in AI Social

Daniel Ajisafe · Oluwabukola Grace Adegboro · Mennatullah Siam · Salomey Osei · ESTHER ODUNTAN · Samson Kirk-Koffi · Nene Azu · Issam Laradji · Blaise Appolinary

7:00 PM - 9:00 PM

Africa has the second-largest population in the world with around 1.4 billion people as of 2022. With the increasing amount of visual data and the growing rate of its data footprint, the impact of extending Computer Vision research to solving local problems specific to Africa has become an ever-increasing need. This social event aims to bring together a unique community of people who self-identify as Black and/or from African origin or support the Black community at its first gathering in CVPR. Our main goal is to create a platform where Black researchers are comfortable meeting with other people without feeling out-of-place and to enforce a strong connection of like-minded individuals whose main or sub-goals is to empower the African community and Black Computer Vision researchers. This social, therefore, has several aims:

Empowering Black and African origin researchers by affirming their sense of belonging to the Computer Vision community specifically in CVPR.
Providing mentorship and guidance to young researchers from the Black and African origin community.
Allowing both Black and African-origin researchers and their supporters/allies to gather and network within the Computer Vision community.
Celebrating African grassroots in AI, especially in the field of Computer Vision.

... more

Social

CV Entrepreneurship – Founders, Freelancers & Friends

Ankur Kalra · Sarah Andrews · Matthew Flagg

7:00 PM - 9:00 PM

CV Entrepreneurship: Founders, Freelancers & Friends comes to CVPR to help entrepreneurially minded members of the community find mentors, collaborators, and friends! Computer Vision is a vibrant and rapidly expanding field, and many folks are choosing to blaze their own paths outside of the corporate and academic worlds. Entrepreneurship presents its own unique mix of challenges and opportunities. Whether you’re already a business owner looking for others who can relate to your experience, or you aspire to venture out on your own in some way, this is the event for you. Everyone has something to share, and something to learn. Walk away with a few new friends, inspiring ideas, some helpful resources, and enthusiasm toward your own entrepreneurial path. The goal of “Each One, Teach One” is to help members of the community develop curated connections over areas of mutual interest. Whether it’s a specific research technique, how to magnify your impact, or how to accelerate your research experiments, someone at CVPR is passionate about sharing their point of view on that topic. Come to this event to meet them!

Everyone has something to share and something to learn. Walk away with a few new friends, some of whom are experts in areas you are curious about, and some of whom are curious about your areas of expertise.

... more