Publications

For the comprehensive list, check out my Google Scholar page.

(* denotes equal contribution or alphabetic ordering, † denotes corresponding author)

2025

FloE: On-the-Fly MoE Inference on Memory-constrained GPU
Yuxin Zhou*, Zheng Li*, Jun Zhang*, Jue Wang, Yiping Wang, Zhongle Xie, Ke Chen, Lidan Shou
ICML 2025
[To appear soon]

Is Your World Simulator a Good Story Presenter? A Consecutive Events-Based Benchmark for Future Long Video Generation
Yiping Wang, Xuehai He, Kuan Wang, Luyao Ma, Jianwei Yang, Shuohang Wang, Simon Shaolei Du, Yelong Shen
CVPR 2025
[Arxiv] [Code] [Poster] [Twitter] [Website]

Infer Human's Intentions Before Following Natural Language Instructions
Yanming Wan, Yue Wu, Yiping Wang, Jiayuan Mao, Natasha Jaques
AAAI 2025
[Arxiv] [Code] [Twitter] [Website]

2024

CLIPLoss and Norm-Based Data Selection Methods for Multimodal Contrastive Learning
Yiping Wang*, Yifang Chen*, Wendan Yan, Alex Fang, Wenjing Zhou, Kevin Jamieson, Simon Shaolei Du
NeurIPS 2024 (Spotlight)
[Arxiv] [Code] [Poster] [Twitter] [Previous Versions]

JoMA: Demystifying Multilayer Transformers via JOint Dynamics of MLP and Attention
Yuandong Tian, Yiping Wang, Zhenyu Zhang, Beidi Chen, Simon Shaolei Du
ICLR 2024
[Arxiv] [Twitter]

2023

Scan and Snap: Understanding Training Dynamics and Token Composition in 1-layer Transformer
Yuandong Tian, Yiping Wang, Beidi Chen, Simon Shaolei Du
NeurIPS 2023 (Oral presentation @ ICML2023-HiDL)
[Arxiv] [Poster] [Twitter]

Improved Active Multi-Task Representation Learning via Lasso
Yiping Wang, Yifang Chen, Kevin Jamieson, Simon S. Du
ICML 2023
[Arxiv]

2022

C-Mixup: Improving Generalization in Regression
Huaxiu Yao*, Yiping Wang*, Linjun Zhang, James Zou, Chelsea Finn
NeurIPS 2022
[Arxiv] [Code]

Preprints

Reinforcement Learning for Reasoning in Large Language Models with One Training Example
Yiping Wang†, Qing Yang, Zhiyuan Zeng, Liliang Ren, Lucas Liu, Baolin Peng, Hao Cheng, Xuehai He, Kuan Wang, Jianfeng Gao, Weizhu Chen, Shuohang Wang†, Simon Shaolei Du†, Yelong Shen†
Preprint
[Arxiv] [Code] [W&B] [Twitter]

SHARP: Accelerating Language Model Inference by SHaring Adjacent layers with Recovery Parameters
Yiping Wang, Hanxian Huang, Yifang Chen, Jishen Zhao, Simon Shaolei Du, Yuandong Tian
preprint
[Arxiv]