Xiang Yue - Publications

Selected Publications

*: Equal Contributions; ✝: My Advisee

On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models

Charlie Zhang✝, Graham Neubig, Xiang Yue

arXiv 2025

Does Math Reasoning Improve General LLM Capabilities? Understanding Transferability of LLM Reasoning

Maggie Huan*✝, Yuetai Li*✝, Tuney Zheng*✝, Xiaoyu Xu, Seungone Kim, Minxin Du, Radha Poovendran, Graham Neubig, Xiang Yue

arXiv 2025

Demystifying Long Chain-of-Thought Reasoning in LLMs

Edward Yeo*✝, Yuxuan Tong*✝, Morry Niu, Graham Neubig, Xiang Yue

ICML 2025
(Also 🏆Best Paper Award at ICLR 2025 Workshop on Foundation Models in the Wild)

Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages

Xiang Yue*, Yueqi Song*, Akari Asai, Seungone Kim, Jean de Dieu Nyandwi, Simran Khanuja, Anjali Kantharuban, Lintang Sutawika, Sathyanarayanan Ramamoorthy, Graham Neubig

ICLR 2025

MAmmoTH2: Scaling Instructions from the Web

Xiang Yue, Tuney Zheng, Ge Zhang, Wenhu Chen

NeurIPS 2024

Grokked Transformers are Implicit Reasoners: A Mechanistic Journey to the Edge of Generalization

Boshi Wang, Xiang Yue, Yu Su, Huan Sun

NeurIPS 2024

MMLU-Pro: A More Robust and Challenging Multi-Task Language Understanding Benchmark

Yubo Wang, Xueguang Ma, Ge Zhang, Yuansheng Ni, Abhranil Chandra, Shiguang Guo, Weiming Ren, Aaran Arulraj, Xuan He, Ziyan Jiang, Tianle Li, Max Ku, Kai Wang, Alex Zhuang, Rongqi Fan, Xiang Yue, Wenhu Chen

NeurIPS 2024 (Spotlight)

OpenCodeInterpreter: Integrating Code Generation with Execution and Refinement

Tianyu Zheng*✝, Ge Zhang*, Tianhao Shen*, Xueling Liu*, Bill Yuchen Lin, Jie Fu, Wenhu Chen, Xiang Yue

ACL 2024, Findings

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI

Xiang Yue, Yuansheng Ni, Kai Zhang, Tianyu Zheng, Ruoqi Liu, Ge Zhang, Samuel Stevens, Dongfu Jiang, Weiming Ren, Yuxuan Sun, Cong Wei, Botao Yu, Ruibin Yuan, Renliang Sun, Ming Yin, Boyuan Zheng, Zhenzhu Yang, Yibo Liu, Wenhao Huang, Huan Sun, Yu Su, Wenhu Chen

CVPR 2024 (🏆 Award Candidate Paper, Oral: 24/11,532=0.2%)

MMMU-Pro: A more robust multi-discipline multimodal understanding benchmark

Xiang Yue*, Tianyu Zheng*, Yuansheng Ni*, Yubo Wang, Kai Zhang, Shengbang Tong, Yuxuan Sun, Botao Yu, Ge Zhang, Huan Sun, Yu Su, Wenhu Chen, Graham Neubig

ACL 2025

MAmmoTH: Building Math Generalist Models through Hybrid Instruction Tuning

Xiang Yue*, Xingwei Qu*, Ge Zhang, Yao Fu, Wenhao Huang, Huan Sun, Yu Su, Wenhu Chen*

ICLR 2024 (Spotlight)

Synthetic Text Generation with Differential Privacy: A Simple and Practical Recipe

Xiang Yue, Huseyin A. Inan, Xuechen Li, Girish Kumar, Julia McAnallen, Hoda Shajari, Huan Sun, David Levitan, Robert Sim

ACL 2023 (🏆 Best Paper Honorable Mention)