Publications | Research

Alexander Popov, Alperen Degirmenci, David Wehr, Shashank Hegde , Ryan Oldja, Alexey Kamenev, Bertrand Douillard, David Nistér, Urs Muller, Ruchi Bhargava, Stan Birchfield, Nikolai Smolyanskiy

GenTranslate: Large Language Models are Generative Multilingual Speech and Machine Translators

Yuchen Hu, Chen Chen, Huck Yang, Ruizhe Li, Zhehuai Chen, Eng Siong Chng

Variable Frame Timing Affects Perception of Smoothness in First-Person Gaming

Devi Klein, Josef Spjut, Ben Boudaoud, Joohwan Kim

FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects

Bowen Wen, Wei Yang, Jan Kautz, Stan Birchfield

CVPR

Do Action Video Game Players Search Faster Than Non-Players?

Zoe (Jing) Xu, Josef Spjut, Ben Boudaoud, Simona Buetti, Alejandro Lleras, Ruth Rosenholtz

Large Language Models are Efficient Learners of Noise-Robust Speech Recognition

YuChen Hu, Chen Chen, Huck Yang, Ruizhe Li, Chao Zhang, Pin-Yu Chen, EnSiong Chng

ICLR

It's Never Too Late: Fusing Acoustic Information into Large Language Models for Automatic Speech Recognition

Chen Chen, Ruizhe Li, Yuchen Hu, Sabato Marco Siniscalchi, Pin-Yu Chen, Ensiong Chng, Huck Yang

ICLR

Is Less More? Rendering for Esports

Benjamin Watson, Josef Spjut, Joohwan Kim, Byungjoo Lee, Mijin Yoo, Peter Shirley, Rulon Raymond

Evaluating and Improving Rendered Visual Experiences: Metrics, Compression, Higher Frame Rates & Recoloring

Pontus Ebelin

Estimates of Temporal Edge Detection Filters in Human Vision

Pontus Ebelin, Gyorgy Denes, Tomas Akenine-Möller, Kalle Åström, Magnus Oskarsson, William H. McIlhagga

2023

HyPoradise: An Open Baseline for Generative Speech Recognition with Large Language Models

Chen Chen, YuChen Hu, Huck Yang, Sabato Marco Siniscalchi, Pin-Yu Chen, Ensiong Chng

NeurIPS

Whispering LLaMA: A Cross-Modal Generative Error Correction Framework for Speech Recognition

Srijith Radhakrishnan, Huck Yang, Sumeer Khan, Rohit Kumar, Narsis Kiani, David Gomez-Cabrero, Jesper Tegnér

Constant Field of View Display Size Effects on First-Person Aiming Time

Josef Spjut, Ben Boudaoud, Joohwan Kim

BundleSDF: Neural 6-DoF Tracking and 3D Reconstruction of Unknown Objects

Bowen Wen, Jonathan Tremblay, Valts Blukis, Stephen Tyree, Thomas Müller, Alex Evans, Dieter Fox, Jan Kautz, Stan Birchfield

CVPR

Subpixel Deblurring of Anti-Aliased Raster Clip Art

Jinfan Yang, Nicholas Vining, Shakiba Kheradmand, Nathan Carr, Leonid Sigal, Alla Sheffer

Luminance-Preserving and Temporally Stable Daltonization

Pontus Ebelin, Cyril Crassin, Gyorgy Denes, Magnus Oskarsson, Kalle Åström, Tomas Akenine-Möller

Efficient Dataflow Modeling of Peripheral Encoding in the Human Visual System

Rachel Brown, Vasha DuTell, Bruce Walter, Ruth Rosenholtz, Peter Shirley, Morgan McGuire, David Luebke

2022

Image Features Influence Reaction Time: A Learned Probabilistic Perceptual Model for Saccade Latency

Budmonde Duinkharjav, Praneeth Chakravarthula, Rachel Brown, Anjul Patney, Qi Sun

Best Technical Paper, SIGGRAPH 2022

As-Locally-Uniform-as-Possible Reshaping of Vector Clip Art

Chrystiano Araujo, Nicholas Vining, Enrique Rosales, Giorgio Gori, Alla Sheffer

Detecting Viewer-Perceived Intended Vector Sketch Connectivity

Jerry Yin, Chenxi Liu, Rebecca Liu, Nicholas Vining, Helge Rhodin, Alla Sheffer

SIGGRAPH

PredictionNet: Real-Time Joint Probabilistic Traffic Prediction for Planning, Control, and Simulation

Alexey Kamenev, Lirui Wang, Ollin Boer Bohan, Ishwar Kulkarni, Bilal Kartal, Artem Molchanov, Stan Birchfield, David Nister, Nikolai Smolyanskiy

ICRA

Filters

Research Areas

Events

2026

2025

2024

2023

2022

Filters

Publication Year

Research Areas

Events

2026

2025

2024

2023

2022