Han Bao

About Me

I am an incoming Ph.D. student at the University of Notre Dame, joining in Fall 2026 under the supervision of Prof. Fanny Ye. Prior to that, I completed my undergraduate studies in Cyber Science and Engineering at Sichuan University.

During my visiting studies, I was mentored by Prof. Xiangliang Zhang and senior researcher Yue Huang, whose guidance shaped my research interests in trustworthy AI and foundation models. I continue to collaborate closely with Zheyuan Zhang.

My research lies at the intersection of LLM agents, reinforcement learning, and trustworthy AI — building systems that are not only capable but also safe, fair, and reliable.

News

May 2026

Two papers were accepted to ICML 2026: Capability-Oriented Training Induced Alignment Risk and Drift-Bench.

Apr 2026

Two papers were accepted to ACL 2026 Findings.

Jan 2026

One paper was accepted to WWW 2026 Demo Track. One paper was accepted to ICLR 2026.

Aug 2024

One paper was accepted to AAAI 2025.

Research Interest

LLM Agent Reliability & Failure Diagnosis

Diagnosing multi-turn agent failures under input faults, interaction noise, and cooperative breakdowns.

This includes: Drift-Bench (ICML'26), IntraAI (WWW'26 Demo).
Alignment Risk & Guardrail Models

Studying training-induced alignment risks and building guardian/advisor models for safer LLM behavior.

This includes: Capability-Oriented Training Induced Alignment Risk (ICML'26), Guardian-as-an-Advisor (ACL'26 Findings), and Edge Alignment (Position Paper).
Trustworthiness Evaluation of Foundation Models

Developing benchmarks and assessment protocols for generative, vision-language, and domain-specific foundation models.

This includes: TrustGen (ICLR'26), AutoDavis (arXiv'25), and PolicyLLM (ACL'26 Findings).

Publications

Journal Articles

CRISP: A Causal Relationships-Guided Deep Learning Framework for Advanced ICU Mortality Prediction

Linna Wang, Xinyu Guo, Han Bao, Lihua Jiang, Li Zhao, Tao Zhu, Ziliang Feng · BMC Medical Informatics and Decision Making · 2025

Conference Papers

LiD-FL: Towards List-Decodable Federated Learning

Hong Liu, Liren Shan, Han Bao, Ronghui You, Yuhao Yi, Jiancheng Lv · Association for the Advancement of Artificial Intelligence (AAAI) 2025 · 2025

On the Trustworthiness of Generative Foundation Models: Guideline, Assessment, and Perspective

Yue Huang, Chujie Gao, Siyuan Wu, Haomin Zhuang, Jiayi Ye, Han Bao, et al. · International Conference on Learning Representations (ICLR) 2026 · Leader of T2I Group · 2026

IntraAI: Bridging Human-AI Understanding Through Intelligent Interface Design

Han Bao, Yue Huang, Xiangliang Zhang, Yanfang Ye · The Web Conference (WWW) 2026 — Demo Track · 2026

PolicyLLM: Towards Excellent Comprehension of Public Policy for Large Language Models

Han Bao, Penghao Zhang, Yue Huang, Rui Su, Zhengqing Yuan, Yujun Zhou, Xiangqi Wang, Kehan Guo, Nitesh Chawla, Xiangliang Zhang · ACL 2026 Findings — Association for Computational Linguistics 2026 · 2026

Guardian-as-an-Advisor: Advancing Next-Generation Guardian Models for Trustworthy LLMs

Yue Huang, Haomin Zhuang, Jiayi Ye, Han Bao, Yanbo Wang, Hang Hua, Siyuan Wu, Pin-Yu Chen, Xiangliang Zhang · ACL 2026 Findings — Association for Computational Linguistics 2026 · 2026

Capability-Oriented Training Induced Alignment Risk

Yujun Zhou*, Yue Huang*, Han Bao*, Kehan Guo, Zhenwen Liang, Pin-Yu Chen, Tian Gao, Werner Geyer, Nuno Moniz, Nitesh V Chawla, Xiangliang Zhang · International Conference on Machine Learning (ICML) 2026 · * Equal Contribution · 2026

Drift-Bench: Diagnosing CoopeRative Breakdowns in LLM Agents under Input Faults via Multi-Turn Interaction

Han Bao, Zheyuan Zhang, Pengcheng Jing, Zhengqing Yuan, Kaiwen Shi, Yanfang Ye · International Conference on Machine Learning (ICML) 2026 · 2026

Preprints & Under Review

AutoDavis: Automatic Benchmarking of Large Vision-Language Models on Visual Question-Answering

Han Bao*, Yue Huang*, Yanbo Wang, Jiayi Ye, Xiangqi Wang, Xiuying Chen, Mohamed Elhoseiny, Xiangliang Zhang · * Equal Contribution · 2025

General Alignment Has Hit a Ceiling; Edge Alignment Must Be Taken Seriously

Han Bao, Yue Huang, Xiaoda Wang, Zheyuan Zhang, Yujun Zhou, Carl Yang, Xiangliang Zhang, Yanfang Ye · Position Paper · 2026

Education

University of Notre Dame

Ph.D.

Ph.D. in Computer Science

Supervisor: Prof. Fanny Ye

Research Areas

Trustworthy AI · LLM Alignment · Foundation Models

Sep 2026 — June 2031 Incoming

Sichuan University

B.Eng.

B.Eng. in Cyber Science and Engineering

Sep 2021 — June 2026

Research Experience

University of Notre Dame

Aug 2024 — Present

Visiting Research Student

Advisor: Prof. Xiangliang Zhang

Trustworthy Generative Models · LLM Alignment · Agent Evaluation

National University of Singapore

July 2024

Summer Workshop Participant

Advisor: Prof. Tianbai Ma

Cloud Computing · Network Traffic Analysis

About Me

News

Research Interest

LLM Agent Reliability & Failure Diagnosis

Alignment Risk & Guardrail Models

Trustworthiness Evaluation of Foundation Models

Publications

Education

University of Notre Dame

Sichuan University

Research Experience

University of Notre Dame

National University of Singapore