WideSeek-R1 - a RLinf Collection

RLinf 's Collections

WideSeek-R1

updated 4 days ago

WideSeek-R1: Exploring Width Scaling for Broad Information Seeking via Multi-Agent Reinforcement Learning

RLinf/WideSeek-R1-4b

Text Generation • 4B • Updated 4 days ago • 48 • 1
RLinf/WideSeek-R1-train-data

Preview • Updated 4 days ago • 34 • 1
WideSeek-R1: Exploring Width Scaling for Broad Information Seeking via Multi-Agent Reinforcement Learning

Paper • 2602.04634 • Published Feb 4 • 96
RLinf/Wiki-2018-Corpus

Updated 4 days ago • 2.67k
RLinf/WideSeek-R1-test-data

Viewer • Updated 4 days ago • 200 • 4