3 21 4

Xiangxin Zhou

zhouxiangxin

https://zhouxiangxin1998.github.io/

AI & ML interests

None yet

Recent Activity

authored a paper 1 day ago

Rethinking the Divergence Regularization in LLM RL

authored a paper 1 day ago

Flow-DPPO: Divergence Proximal Policy Optimization for Flow Matching Models

authored a paper 1 day ago

Beyond Uniform Token-Level Trust Region in LLM Reinforcement Learning

View all activity

Organizations

Collections 2

Papers 9

models 21

datasets 24

zhouxiangxin/TACO_subset

Viewer • Updated Sep 28, 2025 • 4.24k • 6

zhouxiangxin/apps

Viewer • Updated Sep 28, 2025 • 5k • 10

zhouxiangxin/numina_all_subsets_formatted

Viewer • Updated Sep 28, 2025 • 39k • 7

zhouxiangxin/Variational-Posterior-4B-Acc-mix

Viewer • Updated Sep 28, 2025 • 33.4k • 24 • 1

zhouxiangxin/Variational-Posterior-4B-GML-mix

Viewer • Updated Sep 28, 2025 • 33.4k • 24

zhouxiangxin/Variational-Posterior-8B-Acc-mix

Viewer • Updated Sep 28, 2025 • 33.4k • 68

zhouxiangxin/Variational-Posterior-8B-GML-mix

Viewer • Updated Sep 28, 2025 • 33.4k • 56

zhouxiangxin/Variational-Posterior-32B-Acc-mix

Viewer • Updated Sep 28, 2025 • 33.4k • 11

zhouxiangxin/Variational-Posterior-32B-GML-mix

Viewer • Updated Sep 28, 2025 • 33.4k • 76

zhouxiangxin/Variational-Posterior-PB-7B-Acc-mix

Viewer • Updated Sep 28, 2025 • 33.4k • 71

View 24 datasets

Xiangxin Zhou

AI & ML interests

Recent Activity

Organizations

Collections 2

zhouxiangxin/Variational-Reasoning-32B-Acc

zhouxiangxin/Variational-Reasoning-32B-GML

zhouxiangxin/Variational-Reasoning-8B-Acc

zhouxiangxin/Variational-Reasoning-8B-GML

zhouxiangxin/Qwen3-4B-Base-VeriFree

zhouxiangxin/Qwen3-8B-Base-VeriFree

zhouxiangxin/Variational-Reasoning-32B-Acc

zhouxiangxin/Variational-Reasoning-32B-GML

zhouxiangxin/Variational-Reasoning-8B-Acc

zhouxiangxin/Variational-Reasoning-8B-GML

zhouxiangxin/Qwen3-4B-Base-VeriFree

zhouxiangxin/Qwen3-8B-Base-VeriFree

Papers 9

models 21

zhouxiangxin/Variational-Posterior-PA-7B

zhouxiangxin/Variational-Posterior-PB-7B

zhouxiangxin/Variational-Posterior-PA-32B

zhouxiangxin/Variational-Posterior-PB-4B

zhouxiangxin/Variational-Posterior-PB-8B

zhouxiangxin/Initial-Reasoning-32B

zhouxiangxin/Initial-Reasoning-7B

zhouxiangxin/Variational-Reasoning-32B-Acc

zhouxiangxin/Initial-Reasoning-4B

zhouxiangxin/Variational-Reasoning-PA-7B-Acc

datasets 24

zhouxiangxin/TACO_subset

zhouxiangxin/apps

zhouxiangxin/numina_all_subsets_formatted

zhouxiangxin/Variational-Posterior-4B-Acc-mix

zhouxiangxin/Variational-Posterior-4B-GML-mix

zhouxiangxin/Variational-Posterior-8B-Acc-mix

zhouxiangxin/Variational-Posterior-8B-GML-mix

zhouxiangxin/Variational-Posterior-32B-Acc-mix

zhouxiangxin/Variational-Posterior-32B-GML-mix

zhouxiangxin/Variational-Posterior-PB-7B-Acc-mix

Xiangxin Zhou

AI & ML interests

Recent Activity

Organizations

Collections 2

Papers 9

models 21 Sort: Recently updated

datasets 24 Sort: Recently updated

models 21

datasets 24