Jihyung Kil | Publications

2026

Spinning Straw into Gold: Relabeling LLM Agent Trajectories in Hindsight for Successful Demonstrations

Zichao Li, Gang Wu, Zichao Wang, Ruiyi Zhang, Wanrong Zhu, Ryan A. Rossi, Vlad I Morariu, Jihyung Kil

ICLR 2026

paper
GUI-AIMA: Aligning Intrinsic Multimodal Attention with a Context Anchor for GUI Grounding

Shijie Zhou, Viet Dac Lai, Hao Tan, Jihyung Kil, Wanrong Zhu, Changyou Chen, Ruiyi Zhang

ECCV 2026

paper / website
Text-Conditioned Background Generation for Editable Multi-Layer Documents

Taewon Kang, Chris Tensmeyer, Jihyung Kil, Wanrong Zhu, Ming C Lin, Vlad I Morariu

ECCV 2026

paper
Unveiling Inherent Visual Grounding in Multimodal LLMs for Text-Rich Images

Shijie Zhou, Jihyung Kil, Ming Li, Jiuxiang Gu, Curtis Wigington, Rajiv Jain, Changyou Chen, Ruiyi Zhang

ACL 2026
DocPrune:Efficient Document Question Answering via Background, Question, and Comprehension-aware Token Pruning

Joonmyung Choi, Sanghyeok Lee, Jongha Kim, Sehyung Kim, Dohwan Ko, Jihyung Kil, Hyunwoo J. Kim

CVPR 2026

paper
AVA-Bench: Atomic Visual Ability Benchmark for Vision Foundation Models

Zheda Mai, Arpita Chowdhury, Zihe Wang, Sooyoung Jeon, Lemeng Wang, Jiacheng Hou, Jihyung Kil, Wei-Lun Chao

CVPR 2026

paper

VisR-Bench: An Empirical Study on Visual Retrieval-Augmented Generation for Multilingual Long Document Understanding

Jian Chen, Ming Li, Jihyung Kil, Chenguang Wang, Tong Yu, Ryan Rossi, Tianyi Zhou, Changyou Chen, Ruiyi Zhang

arXiv 2025

paper
Representation Shift: Unifying Token Compression with FlashAttention

Joonmyung Choi^*, Sanghyeok Lee^*, Byungoh Ko, Eunseo Kim, Jihyung Kil, Hyunwoo J. Kim

ICCV 2025
GUI Agents: A Survey

Dang Nguyen, Jian Chen, Yu Wang, Gang Wu, Namyong Park, Zhengmian Hu, Hanjia Lyu, Junda Wu, others

ACL 2025

paper