Google at ICCV 2025

October 19, 2025 to October 23, 2025 • Honolulu, United States

Google at ICCV 2025

Google is proud to be an Ultimate Sponsor of the International Conference on Computer Vision (ICCV 2025), a premier annual conference, which is being held Sunday, October 19th through Thursday October 23rd in Honolulu, Hawaii. This year researchers from across Google will be contributing at all levels with 39 accepted papers and active involvement in 63 workshops and tutorials, as well as several in-booth demo sessions.

Attending ICCV 2025 in person? Stop by the Google booth to learn more about how we’re actively pursuing the latest innovations in computer vision. Visit the @GoogleResearch X and Google Research LinkedIn accounts for announcements about Google booth activities (e.g., demos and Q&A sessions, which are also listed below).

Continue below to learn more about how Google researchers are engaged at ICCV 2025 (Google affiliations highlighted in bold).

All session times are provided in HST. Dates and times may be subject to change.

Quick links

LinkedIn
X
- ×

Quick links

LinkedIn
X
- ×

DETAILS

Demos and Q&A at the Google Booth

*Dates and times may be subject to change. Stop by the Google booth (#305) for more details.

TUE, Oct 21 | 12:00PM - 1:30PM
Discover Android XR

Presenters: Federico Tombari, Sean Fanello, Yannick Strümpler, Martin Sundermeyer
TUE, Oct 21 | 3:00PM - 3:30PM
Visual Intelligence: Video Models are Zero-Shot Learners and Reasoners

Presenter: Priyank Jaini
TUE, Oct 21 | 4:00PM - 4:30PM
Video Generation at YouTube

Presenters: Orly Liba, Mitchell McIntire, William Zhu
Wed, Oct 22 | 11:30AM - 12:00PM
Research to Reality: A Google Cloud AI Interactive

Presenter: Ran Li
Wed, Oct 22 | 12:30PM - 1:00PM
Efficient Model Training Through Coreset Selection

Presenter: Elisa Tsai
Wed, Oct 22 | 2:30PM - 3:00PM
Wizard of Oz: An Experiential Time Machine Powered by Google AI Now Playing at the Las Vegas Sphere

Presenters: Irfan Essa, Steven Hickson, Albert Shaw
Wed, Oct 22 | 3:30PM - 4:00PM
Nano Banana: The Latest Gemini Multimodal Generation Capabilities

Presenter: Qifei Wang
Thu, Oct 23 | 11:30AM - 12:00PM
Discover Android XR

Presenters: Federico Tombari, Sean Fanello, Yannick Strümpler, Martin Sundermeyer

Tutorials

Orals

Oral: Tue, Oct 21 | 2:00PM — 2:15PM, Exhibit Hall 3 Poster: Tue, Oct 21 | 3:15PM — 5:15PM, Exhibit Hall 1
EVER: Exact Volumetric Ellipsoid Rendering for Real-Time View Synthesis

Link to paper

Accepted Papers

4D Gaussian Splatting SLAM
Yanyan Li, Youxu Fang, Zunjie Zhu, Kunyi Li, Yong Ding, Federico Tombari

AlignDiff: Learning Physically-Grounded Camera Alignment via Diffusion
Liuyue Xie, Jiancong Guo, Ozan Cakmakci, Andre Araujo, László A. Jeni, Zhiheng Jia

Bolt3D: Generating 3D Scenes in Seconds
Stanislaw Szymanowicz, Jason Y. Zhang, Pratul Srinivasan, Ruiqi Gao, Arthur Brussee, Aleksander Hołyński, Ricardo Martin-Brualla, Jonathan T. Barron, Philipp Henzler

CATSplat: Context-Aware Transformer with Spatial Guidance for Generalizable 3D Gaussian Splatting from a Single-View Image
Wonseok Roh, Hwanhee Jung, Jong Wook Kim, Seunggwan Lee, Innfarn Yoo, Andreas Lugmayr, Seunggeun Chi, Karthik Ramani, Sangpil Kim

CL-Splats: Continual Learning of Gaussian Splatting with Local Optimization
Jan Ackermann, Jonas Kulhanek, Shengqu Cai, Haofei Xu, Marc Pollefeys, Gordon Wetzstein, Leonidas J. Guibas, Songyou Peng

Consistent Time-of-Flight Depth Denoising via Graph-Informed Geometric Attention
Weida Wang, Changyong He, Jin Zeng, Di Qiu

Contrastive Test-Time Composition of Multiple LoRA Models for Image Generation
Tuna Han Salih Meral, Enis Simsar, Federico Tombari, Pinar Yanardag

Erasing More Than Intended? How Concept Erasure Degrades the Generation of Non-Target Concepts
Ibtihel Amara, Ahmed Imtiaz Humayun, Ivana Kajic, Zarana Parekh, Natalie Harris, Sarah Young, Chirag Nagpal, Najoung Kim, Junfeng He, Cristina Nader Vasconcelos, Deepak Ramachandran, Golnoosh Farnadi, Katherine Heller, Mohammad Havaei, Negar Rostamzadeh

FastPoint: Accelerating 3D Point Cloud Model Inference via Sample Point Distance Prediction
Donghyun Lee, Dawoon Jeong, Jae W. Lee, Hongil Yoon

From Image to Video: An Empirical Study of Diffusion Representations
Pedro Vélez, Luisa F. Polanía, Yi Yang, Chuhan Zhang, Rishabh Kabra, Anurag Arnab, Mehdi S. M. Sajjadi

From Prompt to Progression: Taming Video Diffusion Models for Seamless Attribute Transition
Ling Lo, Kelvin C.K. Chan, Wen-Huang Cheng, Ming-Hsuan Yang

Global Motion Corresponder for 3D Point-Based Scene Interpolation under Large Motion
Junru Lin, Chirag Vashist, Mikaela Angelina Uy, Colton Stearns, Xuan Luo, Leonidas Guibas, Ke Li

Improving Rectified Flow with Boundary Conditions
Xixi Hu, Runlong Liao, Keyang Xu, Bo Liu, Yeqing Li, Eugene Ie, Hongliang Fei, Qiang Liu

LayerLock: Non-Collapsing Representation Learning with Progressive Freezing
Goker Erdogan, Nikhil Parthasarathy, Catalin Ionescu, Drew Hudson, Alexander Lerchner, Andrew Zisserman, Mehdi Sajjadi, João Carreira

Magic Insert: Style-Aware Drag-and-Drop
Nataniel Ruiz, Yuanzhen Li, Neal Wadhwa, Yael Pritch, Michael Rubinstein, David E. Jacobs, Shlomi Fruchter

MINERVA: Evaluating Complex Video Reasoning
Arsha Nagrani, Sachit Menon*, Ahmet Iscen, Shyamal Buch, Ramin Mehran, Nilpa Jha, Anja Hauth, Yukun Zhu, Carl Vondrick, Mikhail Sirotenko, Cordelia Schmid, Tobias Weyand

MOBIUS: Big-to-Mobile Universal Instance Segmentation via Multi-Modal Bottleneck Fusion and Calibrated Decoder Pruning
Mattia Segù, Marta Tintore Gazulla, Yongqin Xian, Luc Van Gool, Federico Tombari

ModalTune: Fine-Tuning Slide-Level Foundation Models with Multi-Modal Information for Multi-Task Learning in Digital Pathology
Vishwesh Ramanathan, Tony Xu, Pushpak Pati, Faruk Ahmed, Maged Goubran, Anne L. Martel

MoMaps: Semantics-Aware Scene Motion Generation with Motion Maps
Jiahui Lei, Kyle Genova, George Kopanas, Noah Snavely, Leonidas Guibas

Motal: Unsupervised 3D Object Detection by Modality and Task-specific Knowledge Transfer
Nithin Gopalakrishnan Nair, Srinivas Kaza, Xuan Luo, Vishal M. Patel, Stephen Lombardi, Jungyeon Park

ObjectMate: A Recurrence Prior for Object Insertion and Subject-Driven Generation
Daniel Winter, Asaf Shul, Matan Cohen, Dana Berman, Yael Pritch, Alex Rav-Acha, Yedid Hoshen

Orchid: Image Latent Diffusion for Joint Appearance and Geometry Generation
Akshay Krishnan*, Xinchen Yan, Vincent Casser, Abhijit Kundu

Prior2Former - Evidential Modeling of Mask Transformers for Assumption-Free Open-World Panoptic Segmentation
Sebastian Schmidt, Julius Körner, Dominik Fuchsgruber, Stefano Gasperini, Federico Tombari, Stephan Günnemann

Radiant Foam: Real-Time Differentiable Ray Tracing
Shrisudhan Govindarajan, Daniel Rebain, Kwang Moo Yi, Andrea Tagliasacchi

RoMo: Robust Motion Segmentation Improves Structure from Motion
Lily Goli, Sara Sabour, Mark Matthews, Marcus Brubaker, Dmitry Lagun, Alec Jacobson, David J. Fleet, Saurabh Saxena, Andrea Tagliasacchi

SciVid: Cross-Domain Evaluation of Video Models in Scientific Applications
Yana Hasson, Pauline Luc, Liliane Momeni, Maks Ovsjanikov, Guillaume Le Moing, Alina Kuznetsova, Ira Ktena, Jennifer J. Sun, Skanda Koppula, Dilara Gokay, Joseph Heyward, Etienne Pot, Andrew Zisserman

Shape of Motion: 4D Reconstruction From a Single Video
Qianqian Wang, Vickie Ye, Hang Gao, Jake Austin, Zhengqi Li, Angjoo Kanazawa

Spectral Image Tokenizer
Carlos Esteves, Mohammed Suhail, Ameesh Makadia

SplatTalk: 3D VQA with Gaussian Splatting
Anh Thai*, Songyou Peng, Kyle Genova, Leonidas Guibas, Thomas Funkhouser

StochasticSplats: Stochastic Rasterization for Sorting-Free 3D Gaussian Splatting
Shakiba Kheradmand, Delio Vicini, George Kopanasa*, Dmitry Lagun, Kwang Moo Yi, Mark Matthews, Andrea Tagliasacchi

TAB: Transformer Attention Bottlenecks Enable User Intervention and Debugging in Vision-Language Models
Pooyan Rahmanzadehgervi, Hung Huy Nguyen, Rosanne Liu, Long Mai, Anh Totti Nguyen

TAPNext: Tracking Any Point (TAP) as Next Token Prediction
Artem Zholus*, Carl Doersch, Yi Yang, Skanda Koppula, Viorica Patraucean, Xu Owen He, Ignacio Rocco, Mehdi S. M. Sajjadi, Sarath Chandar, Ross Goroshin

Toward Material-Agnostic System Identification from Videos
Yizhou Zhao, Haoyu Chen, Chunjiang Liu, Zhenyang Li, Charles Herrmann, Junhwa Hur, Yinxiao Li, Ming-Hsuan Yang, Bhiksha Raj, Min Xu

Understanding Museum Exhibits using Vision-Language Reasoning
Ada-Astrid Balauca, Sanjana Garai, Stefan Balauca, Rasesh Udayakumar Shetty, Naitik Agrawal, Dhwanil Subhashbhai Shah, Yuqian Fu, Xi Wang, Kristina Toutanova, Danda Pani Paudel, Luc Van Gool

UIP2P: Unsupervised Instruction-Based Image Editing via Edit Reversibility Constraint
Enis Simsar, Alessio Tonioni, Yongqin Xian, Thomas Hofmann, Federico Tombari

UniRes: Universal Image Restoration for Complex Degradations
Mo Zhou*, Keren Ye, Mauricio Delbracio, Peyman Milanfar, Vishal M. Patel, Hossein Talebi

Visual Chronicles: Using Multimodal LLMs to Analyze Massive Collections of Images
Boyang Deng, Songyou Peng, Kyle Genova, Gordon Wetzstein, Noah Snavely, Leonidas Guibas, Thomas Funkhouser

Visual Intention Grounding for Egocentric Assistants
Pengzhan Sun, Junbin Xiao, Tze Ho Elden Tse, Yicong Li, Arjun Akula, Angela Yao

Workshops

Board & Organizing Committee

Ramin Zabih
- General Chair
Saining Xie
- Broadening Participation Chair
Lijie Fan
- Tutorial Chair
Bohyung Han
- Program Chair
Deqing Sun
- Program Chair
Boqing Gong
- Workshop Chair
Nataniel Ruiz
- Publicity Chair

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Google at ICCV 2025